高通骁龙处理器集成了神经处理引擎sdk,苹果a11仿生处理器加入了神经网络引擎,华为麒麟970整合了全新的npu神经网络计算单元,而按照现在的行业形势,ai在移动平台上显然只是刚开始。
近日,全球顶级移动gpu厂商imagination,就发布了全新的powervr series 2nx神经网络加速器(nna),可用于神经网络的高性能计算,而且核心面积超小、功耗超低。
powervr 2nx号称是目前最高效率的移动ai方案,基于从零设计、独立式的硬件ip全新架构,拥有业内最低的功耗、最高的能效比(单位毫瓦推理inference/mw)、最高的单位面积性能(单位面积推理inference/mm2)、最高的性价比。
它对内存带宽的需求也是业界最低的,最低4-bit位宽即可满足,只相当于对手的25-50%,同时相比于8-bit性能提升60%、功耗降低69%,相对精度只损失不到1%。
imagination宣称,它的性能也是业界领先的,单个核心每时钟周期就能提供2048 mac,并支持多核心扩展,是对手的2倍(但没说具体是哪个对手),同时与单纯的dsp解决方案相比,可提供8倍的性能密度提升。
powervr 2nx的特色在于可以同时支持cnn、rnn、lstm三种神经网络类型,并且支持caff、caffe2、google tensorflow等通用机器学习体系架构,还支持可适用于移动端的tensorflow lite、caffe2go等机器学习体系架构。
因此,它可用于移动、监控、汽车、消费等众多领域,并以非常低的功耗实现神经网络的高性能运算。
imagination也举了很多应用实例,包括ar/vr头戴设备中的特征检测与眼球追踪;汽车安全系统中的行人检测与驾驶员警觉性监控;智能监控系统中的脸部辨识与人群行为分析;网络诈欺检测、内容建议、预测性ux;虚拟助理应用中的语音识别与回应;无人机中的防撞与对象追踪等。
比如说照片识别,高端gpu对1000张照片进行搜索/排序大约需要60秒;消耗1%的电量,可以对2400张照片排序,或者分析1分钟20秒长的视频。
而如果采用powervr 2nx,前者只需2秒,后者可处理428000张照片或237分钟视频。
来源:21ic