chu智东西(公众号:zhidxcom)
文 | 心缘

回到1968年,英特尔创始人罗伯特·诺伊斯和戈登·摩尔希望以两人名字的组合命名新公司——Moore Noyce(摩尔·诺伊斯)。

然而这个名字被一家连锁酒店抢先注册了,无奈之下,两位创始人改取“Integrated Electronics(集成电子)”两个单词的缩写“Intel(英特尔)”为公司名,偏巧,这也是英文单词“智能”Intelligence的前几个字母。

或许冥冥之中,命运已经将英特尔和五十年后的智能化浪潮牵了一条红线。

从数据中心、自动驾驶到物联网,英特尔正在编织一张全面的人工智能(AI)软硬件巨网,试图在滚滚奔涌向前的新一代数据革命中,以前瞻性的布局立于不败之地。

据美国市场研究机构Gartner在1月14日发布的最新报告,2019年全球半导体收入总计4183亿美元,较2018年下降11.9%。

在整体市场陷入低迷状态之际,英特尔却迎来了颇为亮眼的成绩单,不仅时隔三年重返全球半导体市场榜首,而且其第四季度和财年营收均创纪录。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲2019年全球半导体厂商销售额排行榜前十(来源:Gartner)

2020年1月24日,英特尔公布2019财年财报,季度营收突破200亿美元大关,全年营收近720美元,其营收和利润远超分析师预期,推动英特尔盘后股价大涨近7%。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲近五年英特尔股价变化

PC销售表现以及企业和云计算数据中心服务器芯片销售的复苏成为了英特尔亮眼财报表现的两大核心支柱。其数据中心事业部(DCG)作为英特尔转型时期的新生主力军,喜迎连续五年的营收增长,达到234.81亿美元。

在电话会议上,英特尔CEO司睿博(Bob Swan)告诉分析师,在AI和机器学习任务上具有更好性能的服务器新芯片是英特尔强大性能的关键,客户继续将至强处理器作为其注入AI的数据中心工作负载的基础。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲英特尔CEO司睿博

司睿博表示,2019年是英特尔历史上和前景最好的一年。英特尔在2019年创下38亿美元由AI驱动的收入,到2024年,AI市场机会预计将达到250亿美元,其中应用于数据中心的AI芯片规模将达到100亿美元。

那么迄今为止,英特尔在数据中心AI芯片先进架构的布局中,已经为自己攒下多少筹码?

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

一、五年高歌猛进,数据中心业务加速狂奔

2015年,英特尔提出数据将改变未来计算格局,乃至整个世界。

这也是AI开始走向商业化的序幕。

此后五年间,英特尔发起一系列总计近200亿美元的投资收购,借此快速切入多类芯片赛道,以高调的姿态向世界宣告围绕挖掘数据红利转型的决心。

而英特尔的过去一年转型阶段性成绩,已经列在最新的2019财年财报之中。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲英特尔2015-2019财年营收及净利润变化

财报显示,英特尔Q4季度营收202.09亿美元,同比增长8%;净利润为69.05亿美元,同比增长33%;2019财年营收719.65亿美元,较上一财年增长2%,净利润210.48亿美元,与2018财年基本持平。

据英特尔预计,其2020年营收将达到735亿美元,这也超过此前分析师预期。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲英特尔2015-2019财年各业务营收占比变化

除了客户计算(CCG)仍挑着“以PC为中心”的大梁外,数据中心(DCG)、物联网(IOTG+Mobileye)、非易失性存储解决方案(NSG)以及可编程解决方案(PSG)均属于英特尔“以数据为中心”的业务范畴。

“以数据为中心”业务继续向营收占比超50%的目标迈进,除PSG营收较2018财年略有下降外,每个业务均实现两位数的增长。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

其中数据中心业务(DCG)作为仅次于客户计算业务的营收来源,在总营收的占比持续提升。

在云服务提供商客户的强劲需求以及高性能第二代英特尔至强可扩展处理器的持续强劲推动下,数据中心业务Q4营收达72亿美元,同比增长19%,全年营收达234.81亿美元,同比增长约2%。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲英特尔2015-2019财年数据中心业务(DCG)营收及毛利变化

DCG包括针对云、企业和通信基础架构细分市场设计的工作负载优化平台和相关产品,而AI正是这些客户愈发重视的关键能力。

AI算力需求推动着数据中心的计算从单一体系架构过渡到异构系统,“CPU+协处理器”成为AI工作负载的固定组合。

主流协处理器中,GPU雄霸AI训练市场,CPU和现场可编程门阵列(FPGA)占据AI推理领域的主导地位,专用集成电路(ASIC)则正如冉冉升起的新星。

为满足多样化工作负载需求,如今英特尔在数据中心的芯片业务已覆盖标量(CPU)、矢量(GPU)、空间(FPGA)、矩阵(ASIC)。

而这四种计算架构,恰恰也是AI芯片的四类典型代表。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲英特尔数据中心AI多种计算架构芯片布局

二、CPU:至强三代AI进化,霸主地位受三方挑战

至强可扩展处理器是英特尔“以数据为中心”战略的基础。

尽管CPU在多数人眼中是个“头脑发达,四肢简单”的控制者,不擅长做AI处理,但英特尔正努力通过加固至强处理器的AI性能打破这一刻板印象。

时至今日,英特尔至强依然是全球AI推理的主流选择。据此前英特尔透露的数据,至强已经助力市场上80%-90%的AI推理。

2017年,英特尔在第一代至强可扩展处理器中首次建立AI加速能力。2019年推出的第二代至强,AI推理性能比一代提升30倍。将在2020年登场的第三代至强,AI训练性能则再提升60%。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

AI似乎成了至强最大的筹码,英特尔执行副总裁孙纳颐(Navin Shenoy)曾在CES期间特意指出,至强是唯一内置AI的通用CPU。

司睿博也在财报电话会议中表示,客户对第二代至强英特尔至强可扩展处理器的需求非常强劲,专注于AI性能的Cascade Lake系列是英特尔增长最快的处理器,而其增长势头还将随着第三代至强可扩展处理器Cooper Lake的推出,在2020年上半年得到进一步推动。

虽说英特尔在数据中心CPU市场是不二的王者,拥有超过90%的市场份额,但英特尔不敢有丝毫的懈怠。

以AMD、IBM和Arm系为代表的追赶者正来势汹汹。

AMD可谓是2019年表现最佳的半导体股之一,涨幅翻倍,其最新发布的第二代7nm EPYC Rome CPU在制程、密度、功率、性能和价格方面均赢过了英特尔14nm CPU。

2019年Q3财季,英特尔DCG营收同比增长4%,服务器CPU销量下滑6%,不过平均售价(ASP)增长了9%。环比方面,DCG营收增长28%,销量增长20%,ASP增长7%,DCG营业利润率创下新纪录49%。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲英特尔服务器CPU销量同比(YoY)和环比(QoQ)变化

不同于英特尔,由于第二代Epyc处理器需求旺盛,AMD服务器CPU单位出货量和营收环比增长超过50%,取得了AMD自2006年以来最高的季度CPU营收。

亚马逊、IBM、微软谷歌腾讯、Twitter等巨头均宣布在其数据中心部署EPYC处理器,据AMD CEO苏姿丰预测,AMD有望在2020年年中达到服务器CPU市场份额两位数的目标,而这将是此前EPYC占有份额的十倍左右。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲AMD服务器CPU市场份额变化

IBM同样是不同忽视的竞争对手。

为了扭转在数据中心的颓势,IBM近几年一直试图通过创建围绕Power处理器的硬件和软件生态系统,拿下更多超大规模数据中心市场。

例如谷歌在2017年底推出专为AI和高性能计算(HPC)设计的服务器,由IBM Power9处理器驱动。其服务器在HPC领域已相当受认可,最新全球超算排行榜中,排名前两位的超算Summit和Sierra都采用了IBM Power9 CPU。

2019年以340亿美元收购红帽后不久,IBM迈出更激进的一步,宣布完全开源Power指令集,为获取更多中高端服务器市场争取机会。

谷歌已经在涉足Power处理器,今年1月14日,谷歌还宣布将在谷歌云推出IBM Power系统。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲2019年11月更新:全球超算排行榜前五

Arm系服务器则试图在中低端市场撬开一个缺口。

此前AMD、三星、博通、NVIDIA、高通等半导体巨头都曾尝试研发Arm服务器处理器,但随后均不了了之。

不过过去两年,Arm服务器CPU阵营又喜添亚马逊和华为两员大将。随着云计算厂商对陆续转向自研芯片,Arm被视为实现CPU自主可控的优选架构,似乎有吞掉一小块服务器市场蛋糕的希望。

但云计算厂商的企业性质决定他们很难将自研服务器CPU对外销售,真正在内部部署的量级有多大也很难说,更像是云计算厂商握在手里用于以防万一和获得更大议价空间的“备胎”。

总体来看,接下来英特尔作为服务器CPU龙头的地位依然无可撼动,但AMD已成为摆在台面上的不稳定因素,英特尔能否守住自己的市场份额,下一步10nm服务器CPU的棋将至关重要。

三、GPU:红绿之争可能变为三原色互斗

2010年,英特尔将其Larrabee独立显卡项目从公司路线图中抹去,直到去年11月,英特尔首次展示其用于数据中心的GPGPU——Ponte Vecchio GPU。

Ponte Vecchio GPU为HPC建模和仿真以及AI训练而设计,计划在美国能源部Aurora超算中首次亮相。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

Ponte Vecchio GPU将采用英特尔多种先进技术,包括其7nm制程工艺、Foveros 3D和EMIB封装技术、高带宽内存、Compute Express Link互连等。

英特尔尝试采用统一架构Xe来研发图形卡,分别针对低、中、高性能工作负载,提供Xe-LP、Xe-HP和Xe-HPC三种微体系架构。前不久基于Xe-LP的PC用独立图形显卡DG1刚刚在CES期间被剧透。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

自AMD在2006年收购ATI公司后,GPU市场就成为老大NVIDIA和老二AMD独秀的舞台。

NVIDIA一直以来以多种形式为GPU计算开拓新市场,它率先将服务器市场中使用GPU,并且最早收割深度学习加速计算的红利,凭借强大的CUDA生态横行AI和HPC领域,并且在AI训练领域明显处于优势地位。

为了增强在数据中心领域的竞争力,NVIDIA拟以69亿美元买下Mellanox的收购案正在审批阶段,目前已获得美国和欧洲监管机构的批准,接下来还要接受中国监管机构的考验。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

AMD早先CPU业务被英特尔完虐时,主要就是靠GPU业务维系生计,它也是NVIDIA GPU最有力的竞争者。

2018年,AMD面向AI和HPC连发两款Vega架构的7nm GPU,Radeon Instinct MI60和MI50,并声称MI60是最快的双精度加速器,性能高达7.4 TFLOPS。

但AMD在AI和HPC领域始终难以与GPU抗衡,主要缺的还是软件,大多数GPU开发者已经习惯使用CUDA。而NVIDIA并没有将CUDA平台开放给AMD GPU使用,这使得AMD很难在数据中心AI市场扩大自己的地盘。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

英特尔也意识到了构建统一软件的必要性,打造了横跨其旗下各种计算架构的统一编程模型oneAPI。

如果英特尔将自研GPU与CPU结合,可能会打造出一个颇具竞争力的计算平台。那么无论是数据中心还是PC端的GPU市场,未来有望变成RGB三原色的竞争。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

四、FPGA:两强交汇AI赛道

FPGA类产品隶属英特尔PSG事业部,虽然并不划归DCG业务,但同样是其数据中心组合拳中重要的一个组成部分。

作为FPGA鼻祖,赛灵思一直是全球FPGA领域的“独孤求败”,原本被甩在身后的老二Altera,突然在2015年被英特尔以167亿美元高价收购了。

此后,赛灵思和Altera分别走向岔路口的两个方向。

赛灵思仍以FPGA为主线,以可编程为核心思想去探索创新打法;Altera则化身为英特尔PSG事业部,一边作为独立在线加速器,另一边和英特尔至强处理器组合出击AI、5G、自动驾驶等新兴市场。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

有趣的是,从2018年下半年开始,FPGA两大核心玩家频频在一些新动作上“不谋而合”。

比如在收购新创企时,消息都在2018年7月公布。英特尔PSG事业部这厢迎来新成员美国结构化ASIC供应商eASIC,5天后,中国AI芯片独角兽深鉴科技宣布被赛灵思收购。

想办法把FPGA这一陈年老架构玩出新花样时,两家又都选择推出创新的新品牌。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

赛灵思推打造出号称是“赛灵思自发明FPGA以来最卓著的工程成就”的自适应计算加速平台ACAP,并基于这一架构,推出AI推理性能比GPU高8倍的7nm AI芯片和实时推理吞吐量比高端CPU高20倍以上的Alveo U250加速卡。

英特尔也发布了新品牌Agilex FPGA,跟数据中心GPGPU一样,走得是集成英特尔多重创新技术的路线,借助三维封装、Compute Express Link内存一致性加速等技术,实现超快速度和超高灵活性。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

两家还轮流炫技最大FPGA。2019年8月,赛灵思发布号称是全球最大FPGA芯片Virtex UltraScale+ VU19P。2个月后,英特尔Stratix10 GX 10M FPGA用EMIB技术将两个FPGA在逻辑和电气上实现整合,摘走“最大容量”的头衔。

除此之外,回顾过去一年,英特尔频繁提及自己的软件工具和库带来的性能优势和便利性,强调其跨架构统一编程平台oneAPI的价值。

赛灵思同样考虑到优质软件在构建生态中起到的关键作用,推出统一软件平台Vitis,无需硬件专业知识即可自动将Xilinx硬件体系结构调整为软件或算法代码,并把FPGA上的IP、底层的驱动软件以及一系列AI开发套件都打包到Vitis AI平台上供开发者选择。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

从赛灵思2019年10月公布的2020财年Q2财报数据来看,赛灵思的转型战略成效已显,以Alveo、UltraScale+等为代表的先进产品营收同比增长29%,占比持续攀升,约占总销售额的74%。

其数据中心业务涨幅明显,达到创纪录的8100万美元,同比增24%,占总营收的10%,与微软Azure、亚马逊、阿里百度、华为、腾讯等重要客户之间的FaaS业务进一步扩展。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲赛灵思先进产品和核心产品占比变化(2018年10月-2019年10月)

英特尔PSG主要包括FPGA和结构化ASIC,及用在通信、云和企业以及嵌入式市场领域的相关产品。PSG从2016财年起,经过连续三年营收和毛利增长后,在2019财年营收同比下降6.4%,至19.87亿美元。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲英特尔2016-2019财年PSG营收及毛利变化

AI+云计算的兴起,相当于给了赛灵思和英特尔FPGA站在同一起跑线的机会。

目前直观来看,英特尔在壮大生态、吸引中国开发者方面的行动更为丰富,包括在重庆建立FPGA创新中心、举办FPGA创新大赛等等,而赛灵思主要是依靠年末的XDF开发者大会亚洲站来作为集中展示先进技术以及同开发者交流的平台。

五、ASIC:内部赛马?三年收购俩创企

ASIC是为特定目的、任务或应用而设计和制造的定制化芯片,能以高性能和高功效完成非常具体的任务。

从谷歌亮出张量处理单元(TPU)开始,越来越多玩家涌入ASIC AI芯片赛道,英特尔也早在2016年8月就通过大约3-4亿美元收购加州AI芯片创企Nervana布局云端专用AI芯片。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

2019年下半年,英特尔发布Nervana首款商用云端AI训练芯片NNP-T和AI推理芯片NNP-I的新讯,包括投产并完成客户交付,宣布分别与百度、Facebook合作推进定制AI芯片研发工作。

英特尔称Nervana NNP可以进行近乎线性和极具能效的扩展。NNP-T提供了一种高效的分布式训练方式,对95%的大型复杂模型进行线性扩展。英特尔与Facebook合作定制开发的NNP-I,据称在ResNet50上的效率可达4。8 TOPS/W,功率范围为10W到50W之间 。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

2019年12月,英特尔宣布以20亿美元收购以色列AI芯片创企Habana Labs,而Habana打造的产品,也是面向数据中心的AI训练和AI推理芯片。

一石激起千层浪,业界讨论声四起。

有人觉得这一收购只是英特尔战略的持续延续扩张,主要是英特尔为满足AI工作负载的多样性,增强自身数据中心AI产品组合的实力。

也有人认为这是暗示英特尔对此前的AI芯片收购并不满意。一位业内人士直言,英特尔当前的AI芯片产品并不给力,NNP-I性能还达不到宣传的水平。

Nervana和Habana的名字有些相像,架构上看也十分类似,而且产品都是在以色列开发,而且芯片都具备高度可扩展的特点。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

不过两家创企的收购背景截然不同。

Nervana加入英特尔时,只有48人的团队和一个创意,没有带入任何硬件开发。也就是说,NNP系列芯片是在进英特尔后三年打磨出来的。

相比之下,Habana的“嫁妆”就很丰厚,约有150名员工,AI训练芯片Gaudi和AI推理芯片Goya都以问世,性能在业界非常领先,并且已经被一些超大规模数据中心客户使用,在业界收获一片赞誉。

Habana的Gaudi支持远程直接内存访问(RDMA),对于跨网络共享数据或跨加速器结构共享数据,能提供过去芯片无法实现的可扩展能力,并且更加经济实惠又高效。

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高

而NVIDIA意图以69亿美元高价收购的以色列创企Mellanox,其核心技术正是RDMA。

两家创企被收购后的归宿也不同。尽管Habana是比Nervana晚来三年的“后辈”,但Habana并没有被收编由Nervana创始人Naveen Rao掌管的英特尔人工智能产品事业部,而是将作为一个独立的业务部分,直接向英特尔数据中心平台事业部报告。

显然,Habana已经在抢走英特尔戴在Nervana头顶的光环,接下来就要看英特尔如何同时保持这两个如此相似的产品线的生命力。

六、四类芯片如何选型?

我们曾问英特尔人工智能事业部副总裁辛周妍,能否提供不同类型协处理器的选型建议?

英特尔打响数据中心复兴之战!四大架构轰向云端,营收创新高
▲英特尔人工智能事业部副总裁兼英特尔人工智能平台与市场研究总经理Julie Choi(辛周妍)

据她介绍,没有哪一个AI硬件产品可以包打天下,英特尔会根据实际需求,和客户一起去研究最佳选择。

FPGA较擅长要求低延迟高通量的推理运算,选择这一基础架构的客户通常看重FPGA的可编程性,希望能对硬件进行配置。例如微软就基于FPGA进行了大量的深度学习推理。

NNP-INNP-T主要面向超大规模的云服务提供商,Facebook即选择采用NNP-I部署更快、更高效的推理计算,并将他们对先进深度学习编译器Glow的支持扩展到NNP-I。

独立GPU在开发早期目标应用于高性能计算的超算领域,也用在面向大型客户的AI领域

在她看来,NNP-T和英特尔独立GPU推出后,将给市场带来更多针对高密度神经网络训练的替代选择。

结语:AI正成为英特尔数据中心业务的核心

纵观当前AI市场,英特尔CPU在推理市场拥有较高话语权,FPGA的新品牌和生态也在顺利铺陈中,但竞争对手已呈现有力的追击姿态,英特尔的神经还需持续紧绷。

尽管最新财报成绩再度证明了英特尔在PC和服务器芯片市场的掌舵实力,但就目前蓬勃发展的数据中心AI市场来看,英特尔在AI训练领域还没有展现出威胁力的攻势,这就要看其独立GPU、Nervana NNP-T以及Habana Goya未来能否赢得客户的信心。

此次我们所重点讨论的四类架构,只是英特尔投入加速AI发展的六大战略之一。

据司睿博透露,英特尔将加快10nm+的生产速度,7nm的生产计划将在2021年进行,并且英特尔已开始在研究其5nm制程技术。

此外英特尔支持异构融合的先进封装技术、开放合作联盟CXL、加速多芯片通信互连的EMIB技术、深度挖掘硬件性能和能效的软件堆栈、简化编程的跨架构统一软件平台oneAPI、以及在安全、内存及存储技术上的革新,都在为AI工作负载效率、可编程性和可扩展性的提升保驾护航。

数据中心AI芯片玩家们正在兵分两路,一拨倾向于兵分两路的通用型跨行业解决方案,另一拨则重点专攻某一特定领域的数据中心或边缘推理。

英特尔已经非常坚定地持续在广度和深度上同时加大火力,既提供全面的硬件和软件选择,又着力确保各独立产品线性能足够高,未来随着AI模型变得更为复杂和通用,英特尔的系统集成战略也许会迎来厚积薄发的时刻。