近些日子,全球互联网巨头纷纷高调宣布进入半导体行业。阿里、微软、Google、Facebook、亚马逊等都宣布在芯片领域的动作,那么互联网巨头的这些动作又会对芯片行业造成什么影响?本文为您带来详细分析。
阿里、微软、Google、Facebook、亚马逊互联网巨头纷纷入局芯片
我们首先盘点一下互联网巨头近几年来在芯片领域的动作。
Google可谓是互联网公司在芯片领域走得最远的公司。2015年Google就开始在其数据中心中部署自己设计的深度学习加速芯片TPU负责推理,在去年则是推出了第二代TPU可以兼顾深度学习推理和训练,并且还在手机Pixel 2中也部署了自己设计的IPU用以加速图像处理相关应用。此外,Google还把处理器架构领域的两大宗师David Patterson和John Hennessy招入麾下,未来可望在芯片领域有更多产出。
微软也不甘落后,2014年在ISSCC上发表了自己设计的使用在Xbox Kinect 2中的ToF传感器芯片,之后在2016年又发布了自己设计的用在HoloLens中的HPU协处理器芯片,而在近日更是发布了Azure Sphere 物联网平台,其中包含了使用在MCU芯片中的Microsoft Pluton安全模块以保证物联网数据安全。第一款Azure Sphere芯片将会是联发科和微软合作推出的MT3620,其中就包含了Microsoft Pluton。在高性能计算领域,最近在ISCA2018上也发表了EDGE E2芯片原型,据称其效率可远高于传统基于x86或RISC指令集的处理器。
除了Google和微软外,Facebook也开始在芯片领域有所动作,在网站上贴出了ASIC和FPGA设计的相关职位招聘启事。Facebook AI研究负责人Yann LeCun也在twitter上跟帖表示这将会是一个和深度学习相关的芯片设计岗位,据业界预测Facebook正在招募工程师开发和TPU类似的芯片以加速服务器端深度学习应用。
Yann LeCun对于Facebook招募ASIC工程师的tweet
亚马逊也开始在芯片领域的动作,今年年初就开始招募芯片设计工程师,预期将会在Alexa设计中用上自己设计的芯片。
Amazon Lab126招聘芯片工程师的广告
在中国,互联网巨头阿里先是宣布开始研发人工智能加速芯片Ali-NPU,其性能将是目前市面上主流CPU、GPU架构AI芯片的10倍,而制造成本和功耗仅为一半,可以实现比传统GPU高40倍以上的性价比。之后,阿里高调宣布全资收购中天微系统,而该系统目前拥有中国独立知识产权的指令集,阿里此举据信是为了加强自己在物联网领域的布局。
启示一:摩尔定律的尽头是异构计算时代,互联网巨头要自己定制芯片
互联网巨头纷纷布局芯片,意味着原有的半导体产业局面正在发生重大改变。最初,半导体行业作为高科技行业,其发展遵循摩尔定律的方式,每18个月工艺特征尺寸缩小,随着工艺制程的进化,同样的芯片的制造成本会更低,因为单位面积晶体管数量提升导致相同的芯片所需要的面积缩小,另外芯片性能会随着工艺特征尺寸缩小而上升,于是半导体行业走在摩尔定律指导下的周期性性能提升成本降低的高速发展模式。由于其高技术高附加值的特点,芯片的毛利率很高,因此芯片设计公司可以通过把芯片出售给下游企业,就能活得很滋润。
在半导体设计的黄金年代,“芯片设计”这四个字就意味着高技术和高利润率,芯片的原材料是砂子,却能卖出几十甚至上百美金的单价,因此成功的芯片一旦量产就像是开动了印钞机一样。为了增加出货量改善设计复用性,半导体公司往往青睐通用平台式芯片,例如Intel的处理器以及Qualcomm的SoC。
然而,随着摩尔定律越来越接近物理极限,再继续缩小特征尺寸需要的资本量越来越大,换句话说随着特征尺寸缩小,芯片的成本上升很快。芯片的成本包括NRE成本(Non-Recurring Engineering,指芯片设计和掩膜制作成本,对于一块芯片而言这些成本是一次性的)和制造成本(即每块芯片制造的成本)。在先进工艺制程,由于工艺的复杂性,NRE成本非常高。例如FinFET工艺往往需要使用double patterning技术,而且金属层数可达15层之多,导致掩膜制作非常昂贵。
另外,复杂工艺的设计规则也非常复杂,工程师需要许多时间去学习,这也增加了NRE成本。对于由先进制程制造的芯片,每块芯片的毛利率较使用落后制程制造的芯片要高,但是高昂的NRE成本意味着由先进制程制作的芯片需要更多的销量才能实现真正盈利。
随着摩尔定律遇到瓶颈,靠工艺制程提升来增进性能的成本实在太高,因此需要更多根据应用做专用设计,靠架构设计来进一步提升性能,这也是“异构计算”的思路。在过去,半导体公司通常倾向于推出平台式的产品,例如Intel的CPU,Qualcomm的Snapdragon等等,但是这样的通用平台在今天已经无法满足移动设备对于性能和能效比的需求,尤其是在AR/VR、终端人工智能等新兴应用中。