弱AI时代,为什么Imagination的“GPU+NNA”方案更靠谱?

 

2018年12月4日,Imagination在深圳举行了一年一度的技术交流会。在此次交流会上,Imagination推出了几款具有新特性的IP,其中就包括基于2NX基础升级的3NX NNA,以及三款新的GPU:9XEP、9XMP和9XTP。...



总结一下,此次发布会Imagination发布了针对AI和视觉的神经网络硬件加速器PowerVR 3NX NNA;同时还发布了三款新品GPU,分别是PowerVR  9XEP、9XMP、9XTP,基本上从低端到高端应用需求全覆盖。

详解3NX-NNA,升级5大核心带来哪些改变?

2018年可以说是AI芯片的爆发之年,以手机市场为例,芯片厂商对于AI能力的宣传力度已经逐渐超过了传统的CPU和GPU性能。不少业内专家认为,在手机性能过剩的当下,未来手机芯片的竞争焦点将是AI功能。

目前包括高通、华为、联发科、紫光展锐在内的手机芯片公司纷纷押宝AI功能,并在手机SOC中加入神经网络计算的硬件加速器。业界最大的两大知识产权(IP)供应商ARM和Imagination自然也不会缺席。

ARM此前就发布了其第一代机器学习处理器架构“Trillium”,将DeePhi神经网络压缩技术、FPGA的可编程性,以及DSP的低功耗处理能力聚合在一起。
而Imagination则在2017年就发布了全球第一款神经网络加速器PowerVR®2NX NNA(简称2NX),这是一个专门做人工智能硬件加速的IP。作为独立的神经网络加速器, 2NX不需要跟CPU、GPU绑定,既可以辅助加速,也可以独立存在。

Imagination产品部资深总监Neal Forse透露,去年2NX发布后在业界反映非常好,目前已经有两家中国手机厂商签约采用这款IP。
从左到右依次为:

Kristof Beets, Imagination Technologies PowerVR产品管理和技术营销高级总监

Neal Forse,Imagination Technologies视觉和人工智能产品管理高级总监

David McBrien,Imagination Technologies销售和市场营销执行副总裁

刘国军(James Liu), Imagination Technologies副总裁兼中国区总经理

Graham Deacon,Imagination Technologies PowerVR图形处理商务运营副总裁

2018年12月4日,Imagination在深圳举行了一年一度的技术交流会。在此次交流会上,Imagination推出了几款具有新特性的IP,其中就包括基于2NX基础升级的PowerVR® 3NX NNA(简称3NX)。以及三款新的GPU系列,包括PowerVR®  9XEP、9XMP、9XTP。
据介绍,3NX主要针对四大应用市场,包括移动计算(手机、平板),智能安防,消费电子,汽车自动驾驶。其中自动驾驶将是3NX接下来发展的重点市场。
3NX AX3595的多核演进图


相比2NX,3NX有哪些性能上的提升呢?笔者总结了几点:

第一,IP核心数增加。相比2NX的AX2145和AX2185,3NX增加到了5个核,这带来了强大的性能提升。

这5个核心包括AX3145、AX3385、AX3365、AX3595以及一个低端核。其中AX3145的单核算力达到1.2TOPS,AX3385为5 TOPS,AX3365为2.4 TOPS,AX3595为10 TOPS,最低端核为0.6TOPS。

3NX在PPA上的提升
如同CPU、GPU的多核方式,3NX支持多核方式,多核方式带来的好处非常多。首先是性能上,通过多核方式,3NX最高可达到160TOPS的算力,如此高的算力将在汽车等高端应用上产生作用。

“和上一代相比,性能提升了70%,效率提升了40%。功耗降低了40%,带宽降低了35%。” Imagination Technologies视觉和人工智能产品管理高级总监Neal Forse表示,之所以能做到这一点,主要是因为采用了新的无损压缩算法。
3NX-F 可编程的扩展性


3NX系列另外一个关键特性是可编程的拓展性,因此这里叫3NX-F,F代表灵活性。通过增加可编程的扩展性来优化硬件,这样做的目的是让客户实现差异化设计。比如可以让客户不断加入新的技术,如神经网络等,还可以构建一个Open CL的内核。

除了高性能之外,也别忘记了3NX还有一颗低端的0.6TOPS核,这颗核心使得3NX可以实现低功耗的物联网应用。对于一些对功耗和成本比较低的应用,如简单的人脸识别等。还有一些你可能想不到的应用,比如在国外有用3NX来检测街上的流浪汉,避免在冬天这些人被冻死。Neal Forse表示,对于帧率要求较低的IOT市场,以及低功耗、广域网的应用,功耗可以做到非常低,可以实现毫瓦级别的功耗。

作为独立的神经网络加速器,NNA也常被人拿来和寒武纪、地平线等提供XPU的算法公司进行比较。Neal Forse对此没有正面回应,只是表示“我们喜欢这样的竞争”。他同时认为,每家AI厂商的起点都不一样,竞争对手可能用可编程的架构、DSP做神经网络的方案,再加上指令集。而imagination的做法是通过计算优化的方案,看如何通过最优的计算引擎来把神经网络映射到硬件上。“我们的优化是来自线下的编译,而不是在线的执行。”

9X EP、9XMP、9XTP,不管玩什么游戏,总有一款GPU适合你

PowerVR® 9XE 9XM 9XT
前面说了这么多关于人工智能的新IP介绍,但不管怎么说Imagination毕竟以前专门给苹果提供GPU,GPU还是其主打的拳头产品。Imagination的GPU产品线包括PowerVR® XM、XE和XT系列,相比其他竞争对手,PowerVR®系列最大的优势是性能高、功耗低。
PowerVR® 9XE 9XM 9XT主要特性
2017年,Imagination推出了两款PowerVR® GPU产品Series 9XM与9XE,为价格低廉的产品也带来了绝佳的图像体验。此次新品发布会上,Imagination PowerVR®业务部副总裁 Graham Deacon介绍了三款新IP,包括PowerVR® 9XEP、9XMP、9XTP,分别对应不同市场。

9XEP主要关注在低端手机以及数字电视市场,为硬件设备上的GUI以及HMI提供最佳体验,包括休闲游戏等应用。其特点是可在最小面积上提供最高的填充率。9XEP可以达到每个时钟1-8个像素填充率, 每个时钟16-64个FP32 OPS。

采用前代PowerVR®技术的数码相框产品
这个行业更看重用户界面而非游戏性能,要求更高的分辨率。另外数字电视也越来越多采用神经网络来进行语音识别、面部识别、安全特性等应用。机顶盒市场比较看重成本,预计整机价格在40~50美金左右,对于SOC的成本要求很高。

采用前代PowerVR®技术的车载中控产品
此外,9XEP还可以广泛应用于车载中控系统。现在高端汽车可能有5~6个显示屏,除了车载显示屏,在抬头显示、电子后视镜等领域都将开始采用显示屏。
采用前代PowerVR® 技术的面部识别demo


以汽车中常见的应用为例,比如“车道偏离警示”大概需要10个GFLOPs,低性能GPU可以支持这样的性能要求;但是“行人预测”就需要很宽的性能要求,至少需要100个GFLOPS,这些都对GPU提出了更高要求。
▲图为采用9XMP与三星S9+以及华为Mate10 Pro游戏画面的对比,可以看到细节和对比度的差异

9XMP主要是关注游戏以及中端手机市场。其特性是在最低的面积有最好的计算能力,同时还保证成本。主要是关注游戏的性能密度和加了相关的特殊特性,它的处理数量是每时钟4-8个像素,128-256 FP32 Ops。和上一代相比,9XMP在性能密度方面提升了45%,通过增加性能密度的方式改善游戏性能,同时加入专用的纹理缓存以及视觉无损压缩技术(PowerVR® PVRIC4),确保带宽降低50%。
图为9XEP、9XMP、9XTP的画面细节对比
▲PowerVR® PVRIC4第四代视觉无损压缩技术
9XTP可以说是这次发布的旗舰型产品,主要关注最高端的游戏体验。9XTP每时钟可以超过192FP32 Ops,架构可扩展,可以在最低的面积实现更好的算力。

9XTP聚焦于高功效和高性能,有50%配置方面的改进。9XTP同时采用PVRIC4的压缩技术,可实现视觉无损压缩,可以保证内存的带宽降低50%。
9XEP和9XMP IP Core主要采用PowerVR® Rogue架构,这个架构在2010年推出,已经非常成熟和成功。
GPU需求和市场趋势


Imagination PowerVR®业务部副总裁 Graham Deacon认为,除了高端的GPU,其实客户对于低成本的嵌入式GPU需求量也很大。需要更高的性能和特性,但是要求系统成本更低,因此必须提供高密度、低带宽、低功耗、低SOC芯片面积的产品。Imagination的一大优势是可根据客户需求来定制GPU,同时提供更好的灵活性、可扩展性等差异化因素。

AI没想象中强大,GPU+AI更适合提升系统能力

值得一提的是,对于AI硬件加速器的需求增加,是否会对GPU的需求降低呢?Imagination如何在两种IP之间取得平衡?

对于这个话题,Neal Forse认为这两者是互补的,这也是为什么Imagination在发布GPU的同时也发布NNA。

比如一些低端的产品可能只需要通过GPU来进行一部分AI的计算,而一些高端的产品则采用专门的硬件加速器来做处理。

Neal Forse表示,在发展AI运算的过程中,异构性一直是Imagination拥抱的策略。他认为目前深度学习算法存在很大问题,只是做简单的感测识别,无法进行进一步的推理。未来神经网络的性能评价标准将不一定是计算效率的提升,而是机器学习效率的提升。

此外,传感器融合也是未来人工智能的一个发展方向。未来可能每个传感器都会对应一个NNA的引擎,再加上AI数据分析。这样可以大大降低终端的数据处理压力,进一步提升计算结果。

人工智能的未来将如何发展?其实从目前来看业界对于人工智能的关注度过高,但其实AI并没有预想中的那么强大。真正的强人工智能——机器拥有意识,并能够基于认知推理作出决策其实现在业界根本还没摸到边,并且未来技术发展有赖于5G等通信技术的普及。

那么现在的弱人工智能,其实最大的用处是进一步用来增强系统的能力,而非将其作为有一个核心卖点。在现有的芯片封装密度下如何让其获得机器学习的能力?Imagination给出的方案显得比较靠谱,那就是同时提供高性能的GPU和神经网络加速器。

通过GPU来处理AI应用中的可视化操作,比如图像识别和排序、手势识别驱动接口以及实时视频分析等。而神经网络加速器NNA则用来为高级推理和边缘数据处理提供硬件加速。如此一来,客户可以根据自己的需求各取所需。

汽车行业“老司机”,Imagination能否对标Nvidia?

总结一下,此次发布会Imagination发布了针对AI和视觉的神经网络硬件加速器PowerVR 3NX NNA;同时还发布了三款新品GPU,分别是PowerVR  9XEP、9XMP、9XTP,基本上从低端到高端应用需求全覆盖。
另外,作为苹果曾经的GPU供应商,Imagination在手机移动领域的市场地位非常高,目前采用Imagination相关IP的手机客户每年发布上亿颗芯片,可以说与ARM和高通三分天下。

不过随着手机市场近些年的下滑趋势,Imagination也在积极开拓新的市场,比如汽车市场。

Imagination Technologies销售和市场营销执行副总裁David McBrien表示,Imagination多年来一直在为汽车行业提供各种IP模块,其实Imagination和TI、瑞萨等合作伙伴在汽车仪表盘领域已经占据50%的市场份额。

2018年PowerVR®的汽车硬件产品之一是PowerVR® 8XT-A GPU,它支持SoC设计人员所需的增强恢复和可靠性功能,以获得针对数字人机界面(HMI)和自动驾驶汽车的处理器的汽车安全认证(AVS)。Imagination打算通过量身定制的解决方案继续扩展其PowerVR®汽车硬件IP产品组合,除了明年会推出另一款汽车级GPU IP之外,还将提供支持ASIL的NNA,而这又可以与PowerVR® 8XT-A GPU和其他处理模块混合搭配。

除此之外,Imagination还宣布推出PowerVR® Automotive完整产品套装,以促进汽车半导体行业的增长和加速。PowerVR® Automotive结合了硬件知识产权(IP)、软件、工具、文档和长期支持五大基本要素,随着汽车行业迈向全自动驾驶,其可支持市场中的现有客户和新进入者以满足行业的安全标准和性能要求。

很明显,Imagination未来在汽车领域对标的是Nvidia,其未来目标是将GPU和NNA放入更多tear 1的汽车供应商采购列表中。

作者:芯智讯-李坚

相关文章

Intel的晶圆代工业务还没“发威”就要“歇菜”了?

重磅!国产5nm刻蚀机通过验证,将用于台积电5nm芯片制造!

国产替代,MCU成突破口!谁堪重任?

AI跑分排名第一!联发科Helio P90凭什么击败麒麟980、骁龙855?

拟30多亿拿下JDI 33%股权!中国资本还将出资300亿支持建OLED产线

2018财年巨亏49亿美元!丢了苹果订单的高通真要完蛋了?

降噪效果提升6倍以上!将麦克风设计在耳机内部,这款无线降噪耳机不一般!

高通骁龙855详解:没有内置NPU,AI性能如何达到麒麟980两倍?

芯片性能提升5倍,能耗降低30倍!英特尔要用自旋电子技术“复活”摩尔定律!
行业交流、合作请加微信:xintiyan001
投稿请发至:yj@padnews.cn
芯智讯官方交流:221807116


    关注 芯智讯


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册

神经网络 相关文章