3月12日爆料消息称英伟达的下一代GPU架构将基于三星10nm制程,而不是之前报道的台积电7nm工艺,据称使用的10nm制程更接近于三星提供的8LPP技术,另外新的Tegra芯片也将使用相同的制程。
NVIDIA图灵架构服役已经超过一年多的时间,其带来的光追、深度学习抗锯齿目前还并未在游戏中大面积使用,而且对于用户而言似乎接受度也不高。不过图灵架构带来的性能提升却非常可观,尤其是在4K分辨率下,图灵架构显卡带来的提升有目共睹。
随着图灵架构产品不断完善,英伟达安培架构曝光再次曝光,性能将获得更大提升,此次基于安培架构的 GPU有GA102、GA013、GA104、GA106和GA1075款,配置最高的是GA102。
一、实时光线跟踪
英伟达新款GPU将全部支持RTX(实时光线跟踪),这意味着英伟达在安培架构上对RT核心设计进行升级,使其在性能较弱的显卡中也能实现光线追踪的效果。
使用基于光线追踪的算法(包括ray tracing, path tracing, photon mapping, beam tracing, cone tracing等等 )进行图形渲染。渲染对象是包含真实刚体及柔体物理模拟的动态场景。场景分辨率需达到720P,并需要允许动态摄像机以及多光源(点/面光源)。渲染帧率需不低于30并以60为目标,渲染结果应该有较小的(肉眼难于分辨的)噪点。如果是path tracing等蒙特卡洛方法,则还需要无偏的结果(不然会出现局部模糊等artifacts)。
目前的应用包括各类照片级渲染应用中场景设计的快速原型生成,视频游戏中的部分场景渲染。未来的应用领域会更加广阔。但实时的光线追踪的难点在于场景复杂度和需要的真实感渲染效果决定了遍历和相交检测的巨大计算量(场景分割数据结构的重构和光线与场景的相交测试是两项主要计算)。这是渲染领域以及任何模拟计算领域里终极的矛盾:效率和质量的矛盾。
目前的解决方案有两个方向的努力:软件角度和硬件角度,软件角度又可以分为自低向上和自顶向下的优化:BVH和其他层级结构的场景分割(kd-tree, oc-tree, BSP-tree等)是自顶向下的方法,在对场景进行分割时还有一项十分常用的优化算法:Surface Area Heuristic (SAH)。硬件角度的优化又可以分为采用GPU和SIMD的优化以及专门的ray tracing硬件。前者就是对上述软件优化的算法进行针对GPU或SIMD的优化,同时一些并行环境下的数学库函数和其他基本算法如排序等也间接起到了加速的作用。后者就是指将ray tracing中独有的相交检测,场景分割等部分采用专门的硬件来优化。此次英伟达新款GPU将全部支持RTX(实时光线跟踪),RT核心方面的设计已逐步完善。
二、NVIDIA的新核心比上代性能提升了40%
在GeekBench 5测试数据库里面,曝光了两组NVIDIA的新核心,参数暴涨,规格相当的强大,但都达不到8192个CUDA核心。其中一块核心拥有118组计算单元,假如每组继续延续64个流处理器的规格,那么CUDA核心数量就是7552个,低于在此之前爆料的8192个CUDA核心。
另一块核心削减了108组计算单元,于是CUDA核心就只有6912个,至于频率在1.01GHz左右。这样的参数远于8912个CUDA核心。
但我们可不可以这么认为,128组计算单元对应8192个CUDA核心数是这快核心的最大规格,至于118组计算单元和108组计算单元,是阉割后的版本,分别适用于不同的领域。
配置最低的GA107为1280流处理器,4GB显存,最高的GA102 GPU为5376流处理器,12GB显存,其中GA102比上代的RTX 2080Ti性能提升了40%。
三、面对疫情英伟达选择新闻稿公布新品
随着新冠病毒疫情在美国蔓延,许多科技公司已经取消了旅行和活动。此前,Facebook决定取消F8开发者大会。苹果公司在自己的Apple News(苹果新闻)中开设了新冠病毒专题报道。亚马逊将为确诊新冠肺炎或因新冠疫情而隔离的小时工提供病假待遇,希望以此扩大对数十万物流员工的保护。如果确诊新冠肺炎或因此隔离的员工最多可享受两周带薪休假,亚马逊西雅图总部员工以及旧金山湾区和纽约等地的员工之前就被安排居家办公,以减少疫情传播。
受到疫情的影响,英伟达曾宣布将月底GTC的大会改为线上直播。根据外媒anandtech的最新消息,GTC线上直播也将取消,英伟达将会采用新闻稿的形式公布新品。
英伟达表示,新闻稿发布后,该公司仍将举办投资者电话会议,时间是太平洋时间早8点开始(北京时间当日23点),届时该公司首席执行官(CEO)黄仁勋将参加。
本文由电子发烧友综合报道,内容参考自知乎王洋子豪、IT之家,转载请注明以上来源 。