AI芯片最重要的是什么?Arm中国:背后的软件生态
「在2020年之前,对整个产业来说谁的软件好用,谁就能真正的掌控市场。」
撰文 | 寓扬
去年11月份,面向广阔的物联网市场,Arm中国推出人工智能平台「周易」,它主要包括人工智能处理单元(AIPU),以及软件框架Tengine。当时Arm中国称,通过周易平台,能够把芯片的开发周期缩减3-5倍,提升人工智能应用开发的生产效率。
值得一提的是,2018年Arm在中国进行业务分拆后,Arm中国成为中方占主导的合资公司。周易平台也是由Arm中国自主研发。
在最近的一次媒体沟通会中,Arm中国进一步介绍了周易平台,尤其是AIPU的特性,并着重介绍了周易平台的落地应用情况,以及相比时下火热的RISC-V架构的优势。
AI芯片最重要的是什么?Arm中国给出的答案是,芯片背后的整套软件工具链。可以预测,在2020年之前,对整个产业来说谁的软件好用,谁就能真正的掌控市场。
1 周易平台降低AI芯片研发门槛
软银董事长孙正义曾预测,2035年全球将有万亿级IoT设备在线。相比而言,PC时代的容量大约为10亿台,智能手机的容量约为60亿部,而物联网所带来的设备体量将会是成百上千倍的增长。
Arm中国每年的销量统计数据也有力的支撑这一预测。Arm中国生态发展副总裁、OPEN AI LAB创始人兼CEO金勇斌也介绍道,从1991年到2017年,Arm花了近26年实现了1000亿基于Arm芯片的设备。但从2017年开始每年有250亿台基于Arm芯片的设备,预计到2020年,这4年就会实现第二个1000亿。以此估算,到2035年达到1万亿连接设备,这一观点并不激进。
正是看到AI与IoT领域的市场前景,去年在世界互联网大会期间,Arm中国推出AI平台「周易」。它主要包括两部分,一部分是平台上的软件框架Tengine,用来承载算法应用;另一部分是AI处理单元AIPU,专门处理深度神经网络为代表的AI计算。可以说,Tengine软件框架和AI处理单元构成了周易平台的核心要素。
其中,Tengine框架不依赖于AIPU或者专用AI芯片,现有的成熟芯片通过Tengine框架可以把算力提取出来,在本地进行一些AI应用的处理,从而提高了芯片性能,并降低成本。
据金勇斌介绍,现在很多基于周易平台Tengine的使用场景已经落地,比如行车记录仪、ADAS、安防中的人脸识别门禁和闸机等。
他举例介绍道,一个客户开发了一套智能人口管理系统,在单元楼下安装摄像头后,以前需要将采集的人脸数据传到后端数据中心进行处理。现在通过Tengine架构,不需要改动硬件,摄像头就可以自动在前端进行人脸识别,这样大大减少了网络部署成本。据他估算,周易平台所带来的效率提升,可节省近10倍成本。
整体而言,金勇斌称,通过周易平台可以降低AI芯片开发的两个门槛:第一个是SoC集成AI功能的设计门槛,Arm中国可以提供参考设计,提供IP;第二点是降低上层软件的开发门槛,因为仅有芯片还远远不够,芯片之上的软件框架,以及这背后的整套软件工具链都尤为关键。软件最终决定能不能大规模使用,对整个产业来说谁的软件好用,谁就能真正地掌控市场。
2 DSP的局限
周易平台的另一个核心要素是人工智能处理单元AIPU,Arm中国重点介绍了AIPU的特性,以及它相对于市面上另一种流行架构DSP的优势。
Arm中国资深产品经理高锦炜介绍道,AIPU的最大特点是拥有一套AI和神经网络优化指令集,这个指令集也遵循Arm一直以来的生态方式,接下来的每一代处理器都会向前兼容这个指令集,从而保证整体软件生态的延续。此外,周易AIPU还支持可扩展的指令集。
在硬件设计上,周易AIPU兼顾了神经网络处理器所需要的高效率,以及编程的灵活性。目前AI算法迭代很快,基本以一年为开发周期,而芯片的开发周期往往至少要3年。这种不对等性,就需要保持AI处理单元具有灵活的可编程性,从而适应不同的算法。
在软件方面,周易平台提供了一整套完整的工具链,从IP开发到软件开发,包括编译器、性能优化库等,从而提供一键式开发服务。
针对周易AIPU的落地情况,他称目前已经有唱衰基于AIPU做芯片设计,最快明年年中可以看到芯片推出。
目前产业界不少企业用DSP来做AI处理,针对这种状况,高锦炜提出了他的看法。他认为DSP跟CPU一样已经发展了二十几年,但一直没有形成一个比较好的生态,这是因为DSP在设计过程中存在一些缺陷。
一方面,目前存在多个DSP架构,不同DSP架构之间并不兼容,这分散了整个产业软件投入的资源和开发精力;另一方面,DSP的开发没有软件生态维护的概念,这会造成即使是同一个厂家,第一代DSP的指令集或者软件程序,无法使用在第二代DSP上。这对于软件开发来说可能是灾难性的。
3 软件生态决定市场走向
随着物联网的蓬勃发展,新的开源指令集架构RISC-V在芯片江湖可谓声名鹊起。拥抱RISC-V的一种观点称,「RISC-V是IoT时代最适合的处理器架构」,因为从技术的角度来讲,RISC-V具备延展性,非常灵活,既可以做低功耗,也可以做复杂的AI计算。此外,它还具备更强的成本优势。
周易平台则是Arm架构从移动互联网向物联网的延伸,Arm中国又如何看待RISC-V架构的兴起?
金勇斌称,CPU做好其实并不容易,早期CPU有各种各样的架构,RISC-V也不是第一个开源的架构。世界上很多老牌的CPU厂商,包括TI、高通、海思等,他们原来也自己设计CPU,但后来都用了Arm架构,这取决于Arm在低功耗、高性能上的显著优势。AIoT时代,CPU要求更低的功耗,特别是芯片上面需要有软件生态,而RISC-V的软件生态什么时候形成还不清楚。
显然他想表达Arm在架构以及软件生态上的优势,接下来Arm也会依托这也优势进军IoT市场。
面对一个新的IoT市场,新的架构、新的芯片都会涌现,然而做一款芯片只是第一步,背后的软件生态和工具链将会决定这个市场的走向。