去年arm发布的cortex-a75针对ai和ml能力进行了特别优化,同时引入了trustzone技术(芯片级安全技术)和dynamiq big.little拓扑特性。而今年arm宣布最新旗舰cpu——cortex-a76,相比上一代在性能上实现了35%的提升,同时降低了40%的功耗,并在机器学习能力上提升了4倍。
“实现上述进步的原因在于,cortex-a76虽采用和前一代相同的v8.2指令集,但内建的微处理器架构则是从头开始研发,实现了诸多重大改进,包括解耦合分支预测与指令预取、译码宽度更大、更高的整数与向量与浮点运算单元等。同时,cortex-a76是针对7nm工艺定制的全新架构,在搭配7nm工艺时主频可达到3.0ghz。”ian smythe强调。
这一性能相当于pc端英特尔旗下的酷睿i5-7300,如果soc厂商缓存设计得更好,其性能甚至可以媲美i7。联想到此前新一代高通骁龙1000版windows 10arm笔记本,表明arm正着力染指pc市场,但能否借cortex-a76挑战英特尔/amd在pc领域的权威还待合作伙伴的力道以及生态的配合。同时cortex-a76还意欲为智能手机带来笔记本级别的性能,过发挥比前一代产品高达4倍的机器学习性能,解决云端持续互动衍生出的延迟以及安全方面的问题。cortex-a76可谓“身兼重任”。
此外,arm还提供独特的pop技术。ian smythe提及,基于台积电16ffc的cortex-a76 pop ip,可提供目前最佳性能;而对于那些寻求顶尖制程并锁定高端应用的客户,使用台积电7ff制程的cortex-a76和cortex-a55 pop ip将于2018年第四季度上市。arm pop ip可加速产品的实现,缩短上市时间,并充分利用dynamiq big.little的灵活性。
gpu和vpu的跨越
gpu可说是arm未来要发展ai计算生态的主要角色,从第一代bifrost架构开始,就已经针对ai计算所需要的各种场景,包含机器学习中的训练以及推理加速等进行优化。时间节点到了2018年中,mali-g76新晋成为arm最新旗舰gpu。
“mali-g76仍采用bifrost架构,总核配置上限从32核降为20核,每个核心仍然是3个执行单元,但执行单元的线程数增加到8条,也就是每核心24条线程。加上配备texture mapper以及缓存器的优化等,再度提升了30%的性能密度以及30%的能源效率。在7nm工艺的加持下,其性能可提升1.5-2倍。”ian smythe介绍说,“而且新gpu通过支持int8 dot实现了强大的机器学习功能,表现足足是mali-g72的2.7倍。”
除在gpu领域精进之外,面向未来的8k视觉体验,arm推出了最新的高端视频处理器(vpu)mali-v76来占领先机。
ian smythe介绍,8k60规格串流需要4k60格式的视频4倍的带宽,为此arm通过加入额外的axi总线,使处理量增加一倍。此外还将行缓冲区从4096个像素增加到8192个,从而带来额外的效能提升,使得mali-v76不仅支持8k60解码和8k30编码,性能亦几乎是上一代产品的两倍。
即使是当前的高端设备,4k仍未成为标准配备,那么为何市场已开始提前锁定8k?ian smythe认为,产业局势瞬息万变,arm必须针对未来设备的需求提前准备。在未来的高端电视以及更高分辨率的ar/vr头显领域,mali-v76将发挥更大作用。而对于一个8k视频流的替代方案而言,可选择支持4个60fps的4k视频流。
ai仍“借力使力”
虽然在ai布局上,arm看似慢了半拍。但事实上,arm早在2016年就已经把触手伸进多个ai应用领域同时发展,包含号称针对机器学习优化的bifrost gpu 架构,以及针对高端服务器芯片的sve延伸指令集。随着相关方案陆续成熟,采用者也逐渐增加,arm在今年2月推出project trillium,结合开发环境、算法与各大主流机器学习框架,布局从终端到云端所有ai应用开发生态。
而此次推出的无论是cpu还是gpu,在ai性能上均实现了大幅提升,表明arm的ai布局亦在稳妥推进。
至于没有推出单独的ai加速器原因,ian smythe特意指出,目前ai还处于初级阶段,虽然某些厂商选择配备单独的ai加速器,但仍有一些合作伙伴配备gpu来对ai方案进行调适,以其灵活性来进行定制化设计,并可获得arm生态体系的广泛支持。
在近两年的ai热潮中,各家新创产业纷纷推出自有的ai加速器,群雄并起。但arm仍如此“气定神闲”没有染指ai加速器内核,或许有更深的考量。但是,无论是对算法的承载,对计算的优化,对ai生态的构建,arm的时间或许没有想象那么从容。
在连续创造惊人的数字之后,arm的目光更为长远。据最新数据显示,截止2017年底基于arm的芯片出货量已达1200亿片,约占整体市场四成份额。arm资深市场营销总监ian smythe表示,到目前为止基于arm的芯片出货量应已突破1300亿,未来将迈向2000亿。2035年预计将有一万亿的互联设备,而5g、ai、安全、全计算等技术将大行其道,以为用户提供更自由更互连的浸入式体验。基于此arm ip产品线再添生力军,在cpu和gpu层面均实现跃升,除着力渲染可将智能手机实现pc性能之外,染指笔记本电脑市场的野心愈加明晰。来源:集微网