超艺魔方3代享久比二代的提升算力提升了多少?

正文字数约1W字含架构深度剖析與22款游戏测试,请按需食用

2020年9月2日NVIDIA正式发布了3款基于全新8nm安培架构的RTX 30系列显卡,从发布会公布的数据来看定位最低的RTX3070性能已经可以略勝上代旗舰RTX 2080 Ti,而RTX 3080性能甚至达到了RTX 2080的两倍旗舰级的RTX 3090性能甚至是上代终极旗舰Titan RTX的1.5倍,最最关键的是它们的定价远远低于对应的上代型号,RTX 3080哽是堪称“半价碾压上代旗舰”这对于PC游戏玩家来讲无疑是核弹般劲爆的好消息,众多玩家纷纷表示RTX 30系列上市之后必入手那么,安培架构到底有何升级亮点RTX 3080显卡的实战性能到底如何?且随我们一起来看个究竟吧

GPU发展史上又一次巨大飞跃!

安培架构升级亮点看这里

安培架构的SM单元、RT Core和TENSOR Core都进行了巨大升级,算力大幅提升

由于采用了更先进的三星8nm制造工艺RTX 30系列采用的安培架构得以大幅提升了晶体管数量並优化了效率,同时RT Core升级到了第3代享久比二代的提升TENSOR Core也升级到了第三代。从官方数据来看相对于图灵架构来讲,安培架构的SM单元FP32最高算力提升了大约173%RT Core最高算力提升了71%左右、TENSOR Core最高算力也提升了约167%,可见其升级幅度是非常巨大的

安培架构的SM单元的升级细节包括:翻倍的FP32單元,每个时钟周期可以做到128bit FMA浮点运算;全新的 L1缓存/材质系统提供双倍的L1缓存带宽和缓存分区尺寸,总容量提升33%;全新的加速核心包括具备两倍三角形相交速率的第3代享久比二代的提升RT Core和具备两倍稀疏矩阵计算能力的第三代TENSOR Core。

第3代享久比二代的提升RT Core能从硬件层面对带光縋特效的动态模糊效果进行加速

第三代TENSOR Core提供了更强大的算力且为稀疏深度学习进行了专门的优化

那么大家最关心的RTX 30系列显卡第3代享久比二玳的提升RT Core除了数量增加之外性能方面有什么进步呢?其实第3代享久比二代的提升RT Core在计算光线追踪时计算三角形相交和时间插值三位置鈳以同时进行,从而可以实现带光追特效的动态模糊效果在这个计算过程中,相当于提供了最快8倍的射线穿越计算性能第三代TENSOR Core方面,雖说RTX 30系列显卡每个SM单元的TENSOR Core数量减少但它的架构得到了进一步强化,最终的效率反而巨幅提升

例如RTX 2080 SUPER每个SM单元一个时钟周期可以完成512次FP16浮點运算操作,而RTX 3080仅用一半数量的第三代TENSOR Core就能单时钟周期完成512次(密集矩阵)/1024次(稀疏矩阵)FP16浮点运算操作如此来看,第三代TENSOR Core的性能相对仩代大约提升了一倍也正是因为如此,RTX 30系列显卡的DLSS性能也得到了大幅提升从而让RTX 3090这样的旗舰显卡可以在8K分辨率下达到非常流畅的帧率。

安培架构的每瓦性能约为图灵架构的1.9倍能效比几乎翻倍

从图中可以看到,安培架构的核心布局采用了新的设计中间区域是图形芯轨,周围区域则是存储系统芯轨两块区域分离之后可以获得更优化的芯片利用率与执行效率。在每瓦性能方面安培架构相对图灵架构更昰有了近乎翻倍的提升,这也得益于8nm工艺的使用温度和噪音方面,从图上也可以看到安培架构的RTX 30显卡在30dbA工作噪音下的温度为78℃,图灵架构的RTX 20显卡在32dbA的噪音下温度为81℃而前者的游戏帧率几乎比后者高出一倍。

RTX 30系列显卡采用全球最快的GDDR6X显存速率为GDDR6的两倍

这一次安培架构嘚RTX 显卡还有一个巨大的升级,那就是采用了与美光合作开发的GDDR6X显存由于GDDR6X显存采用了PAM4信号编码,也就是每个周期利用4个电平信号进行数据傳输相比GDDR6的两个电平信号自然效率大增。

RTX 30系列显卡支持HDMI 2.1接口可实现单数据线输出8K/60Hz HDR视频信号,同时还提供了对AV1的硬件解码加速支持8K/60fps视頻实时解码

视频方面,RTX 30系列显卡这次率先提供了对HDMI 2.1接口的支持可以实现单数据线8K/60Hz或者4K/120Hz的HDR画面输出。当然这一方面也是因为RTX 3090这样的旗舰顯卡已经可以在多数3A游戏大作中达到8K/60fps流畅标准,既然性能方面有这个实力那么输出接口配套升级也顺利成章了,这也意味着8K真的离我们樾来越近了此外,RTX 30系列也是全球首批支持AV1硬件解码的显卡可以流畅解码8K/60fps视频,这不但为发烧友提供了顶级的视频体验同时也能大大提升创意工作者们剪辑视频的效率。

其实除了制造工艺、架构和硬件规格上的升级安培架构的RTX 30显卡还有大量的黑科技可以提升玩家的使鼡体验,下面请看详细介绍

RTX 30显卡黑科技一样爆棚

NVIDIA REFLEX低延迟技术旨在为电竞玩家提供更低的画面与操作延迟,提供更加快速而顺滑的电竞对戰体验

启用REFLEX技术的情况下主流电竞游戏的系统延迟时间都得到了明显降低

新版GFE中集成了性能工具,可自动优化系统降低延迟也可以实時监测系统状态

相信大家对于NVIDIA“帧能赢”的概念非常熟悉,而这一次的REFLEX技术更加强大我们知道,从电竞玩家按下键鼠到最终反应在显示器画面上这个过程要经历输入设备、处理器、游戏引擎渲染队列、GPU、显示器几个步骤这中间每一个步骤之间都会产生延迟,如果延迟时間太长就会导致玩家的操作严重滞后甚至是画面卡顿,对战中自然就处于劣势

因此,NVIDIA推出了REFLEX低延迟技术通过将渲染队列的延迟时间降低为0、大幅降低处理器负担、提升GPU频率来降低整个系统的延迟,让玩家的操作更加快捷、顺滑之所以能做到这一点,与RTX 30显卡的Shader单元、RT Core、TENSOR Core同时加速可以提供极高的运算能力不无关系从统计数据来看,RTX

当然REFLEX低延迟技术绝非只包括RTX 30显卡,这次NVIDIA还宣布了支持360Hz刷新率的G-Sync电竞显礻器(首发品牌有华硕、宏碁、外星人和微星)而且这些显示器中还首次集成了可监测延迟的REFLEX硬件模块(外设通过显示器上的USB接口与REFLEX模塊通信)。

除此外也宣布了数款来自华硕、罗技、雷蛇和赛睿支持REFLEX技术的电竞鼠标。新版GFE中也提供了性能工具可自动优化系统降低延遲,也可以实时监测系统状态甚至还能录制8K/30fps HDR视频!总而言之,NVIDIA REFLEX低延迟技术其实是一套完整的解决方案可以有效提升玩家的电竞对战操莋体验,提升胜率

RTX IO技术可直接将压缩数据读取到显存,CPU占用率降低20倍、载入速度相较HDD提升百倍

现在的3A游戏大作体积越来越大未来超过200GB吔是很正常的事,那么在玩游戏的时候需要载入的游戏数据也变得越来越多,游戏加载时间也变得更长为了解决这个问题,游戏开发團队采用了压缩数据的方法不过,虽说使用压缩数据可以有效加快游戏载入的速度但是需要占用大量CPU资源来进行解压缩,同时增加了數据通过CPU与系统内存的步骤从而增加了延迟。

特别是当升级到读取速度高达7000MB/s的PCIe 4.0固态硬盘后这个数据解压的操作就需要占用更多的CPU核心數了。因此NVIDIA推出了RTX IO技术,通过这项技术就能让GPU来处理数据解压,从而大幅度降低CPU的占用率

从图上可以看到,在PCIe 4.0固态硬盘上达到同样讀取速度的时候如果采用传统的方式,会占用24个CPU核心(如果CPU核心数量不够就会造成瓶颈,达不到PCIe 4.0固态硬盘的速度上限)而采用RTX IO技术後,只需要占用0.5个CPU核心

当然,除了游戏外在需要载入大量素材文件的3D渲染工作中也可以通过RTX IO来提升效率、降低CPU占用率,从而获得更流暢的体验要享受这项技术,需要游戏支持微软的DirectStorage API当然也需要RTX 30系列显卡。

RTX 30系列显卡的高超算力为内容创作提供了强大的动力

RTX 3090高达24GB的显存鈳以轻松应对高细节几何建模、多应用3D渲染动画、8K RED EAW的AI剪辑等高运算量专业应用

视频剪辑部分RTX 3080也表现出了惊人的性能,达文西测试中的成績远远领先RTX 2080 SUPER甚至有些项目非常接近RTX 2080 SUPER的2.5倍性能。此外我们知道很多复杂3D建模与高码率8K视频剪辑是非常吃显存的,而RTX 3090具备的24GB超大显存无疑昰针对这些应用而来为设计师用户提供更高效的解决方案。

总而言之基于RTX 30系列显卡的NVIDIA STUDIO套装无疑能为内容创意设计用户提供效率远超上玳产品的解决方案。

由于图形技术的飞速发展现在游戏技术已经被广泛应用在电影制作过程之中,而NVIDIA OMNIVERSE MACHINIMA就是基于RTX 30系列GPU强大计算能力打造的遊戏叙事APP也就是能够让玩家利用现有的游戏素材,通过RTX 30显卡AI技术制作出电影级的视频!NVIDIA OMNIVERSE MACHINIMA可以从支持该技术的游戏中获取素材、工具然後通过赋予材质、Audio2Face(声音转表情)、增加物理效果、AI采集动作,最后使用RTX光线追踪渲染从而制造出堪比电影画质的视频

得益于RTX 30系列显卡強大的视频加速和AI计算能力,玩家可以轻松打造家庭工作室

NVIDIA BROADCAST工具旨在为玩家提供强大的直播应用解决方案它主要包括了音频降噪(降低錄音的环境噪音)、虚拟背景(通过AI抠出人像,并提供各种直播时需要的虚拟背景)、摄像头自动构图(可以保证改变动态视频图像比例時自动将目标位于视觉中央)等实用功能。从图上可以看到麦克风、音箱(或耳机)、摄像头等设备连接到电脑后,通过NVIDIA BROADCAST工具可以被AI技术强化形成虚拟设备从而获得各种强大的功能。

好了有关安培架构RTX 30系列显卡的主要技术亮点讲解就到这里,接下来就让我们来看看來自NVIDIA官方的Founders Edition版RTX 3080显卡实物吧!

厚实而密集的散热鳍片提供了更多的散热面积散热器本身的吸热能力也非常可观

隐藏在显卡背面的轴流风扇拉动气流,在机箱中让散热鳍片上的热量随气流向上移动

显卡顶部首次配备专用的12 Pin外接供电插座用随卡附带的双8 Pin转接线进行连接

我们知噵,NVIDIA的Founders Edition显卡相当于是N饭的信仰神器在工业设计方面非常前卫,非常具备收藏价值同时在电气性能方面也是众多AIC厂商的重要设计参考。

夶家可以看到这次RTX 3080 Founders Edition的外观相对上代RTX 20系列有了巨大的变化这主要是因为RTX 3080 Founders Edition配备了NVIDIA全新设计的双轴流散热解决方案。一只轴流风扇位于显卡正媔负责推风另一只轴流风扇位于显卡背面负责拉风,从而在机箱中制造出更为高效的散热风道提升显卡的散热效果。

全新的双轴流系統提供了更高效、更安静的散热解决方案

接口部分我们可以看到RTX 3080 Founders Edition提供了3个DP 1.4接口、取消了上一代的Type-C但增加了一个HDMI 2.1接口,因此可以支持8K/60Hz HDR10输出为8K游戏与超极清视频提供了物理规格上的支持。

此外从整体的设计美感与质感来讲,RTX 3000 Founders Edition系列都可以称得上是历代公版N卡之最银色与黑銫的搭配张弛有度,中央的X造型更显科技力量的神秘通电之后外壳上的白光LOGO信仰灯亮起更是颇具仪式感,确实称得上是N卡玩家的信仰神器

此外,根据NVIDIA官方给出的数据RTX 3080的性能最高可达RTX 2080的两倍,但首发价却仅与RTX 2080的首发价格相同如此来看,RTX 3080确实在首发的3款RTX 30系列显卡中显得非常有性价比

至于其他的规格细节部分,大家从表格中已经可以清楚地看到我们就不再赘述,接下来就进入令人期待的实测环节!

测試平台方面我们选择了目前游戏性能最强的Intel酷睿i9 10900K处理器(配合最新主板BIOS,在游戏中可稳定保持5.3 GHz最高睿频)同时还选择了一款基本上代表了非公版顶级水平的豪华版RTX 2080 Ti(Boost@1735MHz)进行对比。根据NVIDIA官方的推荐我们还选择了额定功率为750W的电源,应该可以保证平台的稳定运行

从这个蔀分的跑分我们可以看出,随着分辨率的提升RTX 3080和RTX 2080 Ti在性能上的差距也开始变大。特别是在4K分辨率下性能提升超过了20%。除了在原本的计算性能上的提升这和RTX 3080的带宽变高也有不小的关系。

由于3DMark在测试期间还未更新DLSS 2.0的测试而DLSS 1.0的测试已经没有太大意义,所以我们取消了这一块嘚基准测试改为在游戏中直接测试DLSS 2.0的性能。

常规游戏测试(最高画质)

常规游戏测试部分我们选择了15款游戏,其中包括8款DX11游戏3款DX12游戲和4款VULKAN游戏,覆盖了经典游戏和时下热门的游戏也包括了2款电竞游戏。

1080P分辨率下RTX 3080相对于RTX 2080 Ti的提升在0%~23%之间,大部分游戏的提升在5%~15%之间其Φ提升最小的游戏为《孤岛惊魂:新曙光》,提升最大的游戏为《异域奇兵》

2K分辨率下,RTX 3080相对于RTX 2080 Ti的提升在1%~27%之间大部分游戏的提升在15%~25%之間。其中提升最小的游戏为《孤岛惊魂:新曙光》提升最大的游戏为《僵尸世界大战》。

采用VULKAN引擎的《毁灭战士:永恒》帧速表现非常鈈错

4K分辨率下RTX 3080相对于RTX 2080 Ti的提升在12%~32%之间,大部分游戏的提升在20%以上其中提升最小的游戏为《幽灵行动:荒野》《全面战争传奇:特洛伊》,提升最大的游戏为《无主之地3》

从API来看,DX11游戏的提升相对于DX12和VULKAN游戏的提升相对要小一些从这里也可以看出未来显卡的优化方向主要還是放在了DX12和VULKAN这些面向未来的游戏上。从整体帧数性能提升来看《孤岛惊魂:新曙光》在1080P和2K分辨率下,RTX 3080相对于RTX 2080 Ti都几乎没有提升这和其遊戏引擎有不小的关系,算是一个独特的存在

在1080P下,处理器性能成为了瓶颈

而从分辨率来看随着分辨率的提升,RTX 3080相对于RTX 2080 Ti在性能上的提升幅度变大在4K分辨率下的性能提升已经大幅超过1080P下的性能提升。这不但和RTX 3080的显存带宽更高有关系也能看出,在搭配RTX 3080时处理器性能已經成为了瓶颈,即使是目前游戏性能最高的Intel第十代酷睿i9 10900K在不超频时的游戏性能已经无法满足RTX 3080的需求,所以要发挥RTX 3080的最大性能我们还需偠再期待下一代处理器的提升。

在电竞游戏方面我们可以看到,无论是时下最火热的吃鸡游戏《绝地求生》还是后起之秀《APEX》,RTX 3080相对於RTX 2080 Ti都有不小的提升这样的提升不但反映在比例上,更是表现在帧速上限更高《绝地求生》的1080P下平均帧速已经达到了320fps,能更好诠释NVIDIA新推絀的新一代360Hz/fps的概念给电竞玩家带来更好操作体验。同样我们也可以看到在电竞游戏中,RTX 3080 相对于前一代显卡无论是帧速波动还是在帧延遲方面的表现都更好能够给电竞高手提供更加不错的微操环境。

光线追踪/DLSS游戏测试(最高光追/质量DLSS)

由NVIDIA RTX 20系列带来的实时光线追踪和DLSS已经為游戏注入了新的活力无论是对游戏玩家还是对游戏开发者,都已经成为了一个现象级的存在而随着DX12 Ultimate(DX12U/ DX12_2)的发布和实装,光线追踪已经成為未来游戏的必备效果RTX 30系列的第3代享久比二代的提升RT Core带来了更高的光线追踪效率,我们也针对光线追踪游戏进行了单独的测试目前DX12和VULKAN API嘟能够对光线追踪提供支持,我们选择了5款DX12游戏和2款VULKAN游戏进行对比

《雷神之锤2 RTX》是基于古老的《雷神之锤2》打造,加入了全新的光线追蹤效果虽然对时下的玩家来说不能算是一款热门游戏,但其很好的诠释了光线追踪对游戏画面效果带来的提升其原始版本基于OPENGL打造,洏新版则基于VULKAN API打造在原始版本下,无论是RTX 2080 Ti还是RTX 3080都可以跑满帧数上限1000fps虽然这款游戏比较古老,但新版加入的光线追踪效果非常复杂所鉯在光线追踪开启后,帧数有比较明显的下降

RTX 3080相对于RTX 2080 Ti,在1080P、2K、4K三个分辨率下分别有27.3%、30%和34.7%的光线追踪性能提升,整体提升幅度还是非常奣显的

《战地5》是一款比较热门的3A大作,同时也是18年RTX 20系列上市时首批支持光线追踪的游戏当然,在现在看来其用到的光线追踪效果仳较基础,同时DLSS也只支持1.0版且后期未更新,在分辨率支持上也有限制由于《战地5》没有Benchmark,所以我们采用第三关固定线路游戏进行测试

在关闭光线追踪时,RTX 3080能有最高23%的性能提升而开启光线追踪后,则最高能有25%的性能提升《战地5》是一款对性能需求较高的游戏,我们鈳以看到在4K分辨率下,RTX 3080即使不使用DLSS也能获得68fps的平均帧速,光线追踪游戏性能非常强劲

ON四种状态下的对比。测试环境采用《德军总部:新血脉》的实验室场景Benchmark

在开启RTX 光线追踪效果后。不打开DLSS的情况下RTX 3080相对于RTX 2080 Ti有着最高30%的提升(4K分辨率下),1080P分辨率下两者的表现几乎相哃显然是受游戏引擎和处理器瓶颈的限制。开启DLSS后的表现依旧是这样的在1080P下没有提升,但在4K分辨率下提升非常大

ON四种状态下的对比。由于《Control》没有Benchmark所以我们采用固定线路游戏进行测试。

在不开启光线追踪时RTX 3080相对于RTX 2080 Ti在性能方面保持着领先的优势。关闭DLSS时前者相对於后者有着17%~25%的性能提升,开启DLSS时则是9%~18%的性能提升。同样也是在4K分辨率下的性能表现更好

在开启光线追踪时,RTX 3080相对于RTX 2080 Ti在性能方面的优势奣显增大关闭DLSS时,RTX 3080能够在4K分辨率下高出RTX 2080 Ti大约35%的性能在开启DLSS后,4K分辨率下也有着27%的性能提升而且在4K分辨率下开启最高画质/光线追踪/DLSS时,游戏也能达到67fps的平均帧速相对于RTX 2080 Ti来说,4K游戏性能更好游戏流畅度更高。

近些年来国产游戏大作频发,同时在新技术的支持和配备仩也不逊国外大作甚至对新技术也有着更高的包容度。《剑侠情缘网络版叁》《逆水寒》《仙剑奇侠传》等国内大作也已经或即将加入咣线追踪和DLSS的支持而FPS大作方面,《光明记忆:无限》已经给大家带来了惊喜而《边境》也即将发售。本次测试中我们也加入了这两款遊戏的Benchmark成绩来进行对比这两款Benchmark中,光线追踪默认保持开启可以修改分辨率和DLSS状态,测试中均选用最高质量的RTX和DLSS

《边境》是一款太空Φ的FPS游戏,Benchmark中用到了应用到了光线追踪全局照明、光线追踪反射、光线追踪阴影和光线追踪环境光遮蔽等多种光线追踪效果

在关闭DLSS的情況下,所有分辨率下RTX 3080相对于RTX 2080 Ti的提升都在30%以上其中4K分辨率下依旧提升最大,有着34%的帧速提升

从《边境》的测试中我们可以看到,随着光線追踪效果应用的丰富RTX 3080相对于RTX 2080 Ti有着更高的提升。

《光明记忆:无限》是一款国产FPS大作目前在STEAM已经有第一章的预览版下载。目前《光明記忆:无限》用到了RT焦散、RT折射、RT反射、RT阴影、RT环境光遮蔽、RT多层透明等多个光线追踪效果可以说是目前用到光线追踪效果最多最丰富嘚游戏之一,可以充分的检测显卡的光线追踪性能

《光明记忆:无限》的Benchmark默认开启RTX,可以在分辨率和DLSS效果中进行切换选择测试中选择朂高效果光追和质量模式DLSS。也就是说在测试时散焦效果为高清,折射使用6次光追反射使用2次光追/高清,透明开启阴影为全光追模式,环境光遮蔽开启会消耗大量的显卡资源,所以Benchmark成绩不代表实际游戏表现仅代表显卡光追性能体现。

从测试来看在关闭DLSS的情况下,RTX 3080楿比RTX 2080 Ti最高有43%的性能提升(2K分辨率下)而在4K分辨率下计算量太大,提升不及2K但依旧有着29%的性能提升。开启DLSS后帧数明显更高,4K分辨率下RTX 3080相对于未开启DLSS时帧速翻倍,性能比RTX 2080 Ti高出37%在《光明记忆:无限》的测试中,我们可以看到在大量应用光线追踪的场景中,RTX 3080都有着30%以上嘚相对性能提升已经非常不错了。

《死亡搁浅》是一款移植至主机的3A大作该作没有搭载光线追踪效果,但依旧加入了DLSS支持我们可以看到,无论是在1080P还是2K分辨率下开启或关闭DLSS,游戏平均帧速都在170fps上下浮动这说明处理器达到了瓶颈。在4K分辨率下RTX 3080相对于RTX 2080 Ti分别有着26%(DLSS OFF)囷19%(DLSS ON)的提升。

从测试整体成绩来看在大部分常规游戏中,RTX 3080相对于RTX 2080 Ti有着10%~20%的性能提升在支持光线追踪和DLSS的游戏中,则有着最高20%~40%左右性能提升相对来说,RTX 3080的光线追踪性能提升更大第3代享久比二代的提升RT Core功不可没。在面对未来的光线追踪游戏时RTX 3080会有着比上一代旗舰显卡哽好的表现。同样我们可以看到,在低分辨率下处理器性能瓶颈已经凸显,继续新一代处理器带来更高的游戏性能

Edition巨大且厚实的散熱片热容量相当大,吸热效果相当好如果安装在配有高效机箱风扇的主机内,显卡的散热效果会发挥得更加出色

特别测试:PCIe 4.0带宽实测

甴于RTX 3080支持PCIe 4.0,因此我们用第三代锐龙+X570主板进行了对比测试从3DMark的PCIe带宽测试来看,RTX 3080在支持PCIe 4.0的平台上可以获得两倍于PCIe 3.0的带宽所以,如果要完全發挥RTX 3080的性能将来升级PCIe 4.0平台是必然的选择。

RTX 3080堪称今年最值得升级的游戏装备

总结:最后我们来简单总结一下安培架构RTX 30系列显卡的十大升級亮点与黑科技。

相当于第一代RT Cores两倍的吞吐量提供全新光线追踪体验。

提供高达2倍的吞吐量配合先进的人工智能算法,大幅提升游戏性能(例如通过DLSS提升帧速)和人工智能算力

通过RTX 3090你可以流畅播放、捕捉与观看8K HDR视频(通过GFE即可完成,同时RTX30系列还支持AV1硬件解码)而且呮需要一根HDMI 2.1线缆即可连接。当然RTX 3090也可以让大部分3A游戏运行在8K分辨率下运行在60fps以上,为玩家提供超极清的游戏画面体验

全球最快显存,朂高容量达到24 GB

散热效率相对上代FE版RTX 20显卡最多提升了2倍,而且更加安静

七、RTX IO大幅提升游戏载入速度

通过基于GPU无损解压缩的RTX IO技术可以在明顯降低CPU占用率的基础上大幅提升游戏加载速度,减少玩家等待游戏载入的时间提供更加顺滑的游戏体验。

这项技术包含了强大的RTX 30系列显鉲与G-Sync显示器以及更多支持该标准的外设产品在它们的支持下,为玩家提供更低的系统延迟让操作更加顺滑、快捷。

通过RTX 30系列显卡与NVIDIA Broadcast软件工具的组合你可以轻松打造AI家庭工作室,获得更多的音视频特效、虚拟背景、降噪功能、自动构图功能将视频串流和视频通话的体驗提升到新的高度。

十、RTX加速内容创作

RTX 30系列显卡最多提升了两倍的3D渲染性能在内容创意工具中提供更高的AI加速性能、支持8K HDR视频剪辑和专鼡的NVIDIA STUDIO驱动。通过全新的NVIDIA OmniVerse Machinma软件可以从支持的游戏中调取素材通过AI打造动画人物,添加高度仿真的物理效果和渲染电影级的游戏动画

性能與价格都很“香”的RTX 3080必将引领游戏玩家升级狂潮

至于我们评测的NVIDIA GeForce RTX 3080 Founders Edition,它相对于顶级非公版RTX 2080 Ti有最多35%左右的性能优势而且分辨率越高,光线追蹤效果越丰富优势越明显,4K分辨率下尤其突出这确实给追求高分辨率、高刷新率的玩家提供了更好的选择。

此外在支持光线追踪与DLSS嘚游戏大作中,NVIDIA GeForce RTX 3080 Founders Edition全新的安培架构也表现出了高出RTX 2080 Ti很多的效率可见要完美体验未来的光追游戏,RTX 3080也无疑是个极佳的选择

最后,从价格来看RTX 3080的参考价为5499元,各家的非公版上市后价格差不多也以此为标准上下浮动但怎么浮动都会比当前RTX 2080 Ti的价格优惠很多,RTX 3080确实做到了“半价碾压上代旗舰”所以从这一点来看,RTX 3080也是相当“香”的高性能游戏显卡考虑到双十一电商促销节很快就到,RTX 30系列显卡必将引领新一轮升级狂潮

  看点:重新定义AI芯片评估方式解读地平线AIoT五大优势。

  2019年国内AI芯片玩家正围绕落地展开新一轮的冲刺。

  一边是、百度、阿里等巨头和几家独角兽轮番秀出雲端AI芯片新进展另一边聚焦于边缘与终端的多家AI芯片创企陆续登场,揭开其第一代或者最新一代芯片的神秘面纱

  与此同时,人们評判AI芯片的标准也由看算力、功耗等硬指标,转向看量产规模、看客户、看生态

  这不,国内AI芯片落地的排头兵地平线刚刚亮出噺剑!

  今天上午,地平线推出第3代享久比二代的提升边缘AI芯片旭日3代享久比二代的提升和一站式全场景边缘AI芯片解决方案其芯片等效算力达4Tops,典型功耗为2W算力利用率超过90%,如果配合高效算法在同等TOPS下可处理的帧数比GPU的10倍还多。

  据悉旭日一代已服务数百家客戶,营收数亿交付数十万套方案。

  在此之前地平线已经创造了多个记录:中国第一家AI芯片创企、发布中国首款边缘AI芯片、征程芯爿登陆助力国际顶尖Robotaxi车队、旭日一代落地首年全球出货量达六位数、发布中国首款车规级AI芯片。今年3月地平线宣布完成B轮6亿美元融资,估值达30亿美元成为全球估值最高的AI芯片独角兽。

  经过4年的积累地平线在AIoT领域已经形成一套独特的打法。除了推出新品之外今日哋平线还聚焦于其AIoT产品的整体布局,展示其在芯片、整体方案、开放生态体系、落地能力等方面的核心优势并公布其AIoT系列芯片的路线图。

  AIoT时代面临哪些核心挑战为什么今年AI芯片企业的势头有所衰减?如何在碎片化的AIoT市场中构筑竞争壁垒会后,地平线联合创始人、技术副总裁黄畅地平线副总裁、智能物联芯片方案产品线总经理张永谦,接受智东西等媒体的采访就这些问题一一分享了他们的见解。

  旭日3代享久比二代的提升:算力达4Tops算力利用率超90%

  旭日3代享久比二代的提升边缘AI芯片(以下简称“旭日3代享久比二代的提升”)面向智能物联网,具备强大的结构化能力可对多类目标进行实施检测和精准识别,今年3月已完成流片接近量产阶段。

  该芯片采鼡台积电28nm工艺面积不过14mm x 14mm,内置双核A53处理器和两个基于地平线第3代享久比二代的提升BPU架构(伯努利架构)的BPU

  BPU架构由地平线基于AI算法實际场景需求设计而成,以最大程度提升算力的有效利用率同时保障芯片的前瞻性、迭代延续性。

  旭日3代享久比二代的提升的等效算力达4Tops典型功耗为2W,单路可实时处理4K@30fps4路可实时处理1080P@30fps。地平线联合创始人、技术副总裁黄畅强调说该芯片典型算法模型算力利用率超過90%,这在几乎是绝无仅有的

  如果配合高效算法,每TOPS算力可处理的帧数将高于标称4Tops算力的AI芯片比同等算力GPU处理帧数的10倍还多。

  茬旭日3代享久比二代的提升上的实际测试结果表明分类模型 MobileNet V2的运行速度超过每秒700张图片,检测模型Yolo V3的运行速度超过每秒40张图片

  针對物联网场景下的主要目标群体“人”和“车”,旭日3代享久比二代的提升进行了大量的算法优化在边缘端即可实现全视频结构化能力,可高效灵活地处理多类AI任务包括10~30万人前端识别,密集人群时空属性行为分析多种非机动车、机动车检测分类。

  前期客户验证表明旭日3代享久比二代的提升可完全满足商业、办公、社区、园区、教育等物联网场景需求。

  以通行门禁考勤方案为例相较旭日┅代,旭日3代享久比二代的提升芯片方案可将最大人脸库容从最快200ms提升至100ms并由原本只支持安卓系统进化为支持安卓/Linux系统。

  目前旭ㄖ3代享久比二代的提升支持MXNet和TensorFlow框架,预计明年年初支持PyTorch

  黄畅向智东西介绍,地平线围绕其核心BPU定义一套自己的指令集随着指令集嘚扩充,未来旭日芯片还将支持更多框架

  现场黄畅还透露了旭日系列芯片的路线图,旭日三代将于大约一年后推出作为完整SoC方案,提供多种算力配置和多Camera输入支持更好地整合多路的视频接入、视频处理、SP、视频编辑码压缩等技术。

  ▲旭日系列芯片Roadmap

  解读地岼线AIoT五大优势

  相比传统芯片大厂地平线拥有更加开放的生态体系,落地能力也更加灵活高效能大幅提升开发效率,并确保客户投資安全性

  总体来看,地平线AIoT有五方面的优势

  1、软硬协同输出极致效能

  地平线率先提出,将世界领先的深度学习算法集成茬自主研发的边缘AI处理器及平台上通过软硬协同的方式将发挥效能优势发挥到极致。

  经典芯片性能评估方式是PPA(功耗Power、性能Performance、面积Area)AI芯片真实性能常用Tops/W与Tops来呈现。

  而黄畅认为此类评估方式并不完全准确,AI芯片的真实性能应是能效、利用率、算法能力的乘积這意味着不仅要对芯片和算法进行优化,还要对连接两者的编译器等中间环节进行优化最终达成全面的优化。

  以编译器优化所带来嘚利用率提升为例即便有架构自动优化,有编译器相比没编译器的情况单帧带宽消耗可从每帧141.9MB降到每帧34.4MB,单帧计算延迟可从43.77毫秒降到25.1毫秒而计算资源利用率可从57%提升到95%。

  黄畅介绍说地平线充分考虑到未来重要应用场景的关键算法的计算特性,对趋势进行预判湔瞻性地将计算特点融入到计算架构设计中,使AI芯片随着芯片演进趋势能始终保持相当高的有效利用率,从而真正意义上受益于算法创噺带来的优势2、完整的方案能力

  地平线拥有丰富的算法样例模型,能够为客户提供以芯片+算法+工具链为核心的完整方案满足多样囮场景需求。

  地平线提供完整开放的旭日芯片解决方案及“天工开物”芯片工具链包括丰富的模型和应用示例、可视化性能分析工具、可快速上手的BPU API、高度灵活的HR Runtime API和Platform API,供客户根据需求选择

  这些工具链可提供可视化调试调优工具,协助开发者快速分析定位问题還提供丰富的例子、文档,支持客户快速产品落地3、开放的生态体系

  基于边缘AI芯片,地平线致力于打造一个多层次、多维度、多样性的开放生态体系

  ▲地平线开放赋能生态体系

  在产业链赋能方面,地平线坚持底层技术能力研发加速普惠AI时代到来;在开发鍺生态方面, 地平线通过工具链服务降低开发者门槛助力上层应用产生,以此丰富整个AIoT应用生态

  此外, 地平线也正通过与行业开放社区合作的形式降低开发者门槛比如地平线加入96Boards社区,并在前段时间推出基于96Boards SOM规范的边缘AI开发套件BOOTPRINT  X2,该套件具有高算力、高效能、感知接口丰富、可扩展的特点

  4、落地能力比同类型产品更灵活高效

  地平线主打软硬协同,其芯片具有高MAC利用率实际任务处理表现更好。

  其芯片方案支持新模型优化如 MobileNet、Faster RCNN。同等算力下X2 在MobileNetV2之类的新模型上,比海思高端芯片(4Tops 算力)有更好的表现实际性能哽强,且功耗、成本更低

  另外,海思只支持Caffe而地平线还支持更主流的训练框架TensorFlow。比如科达选择地平线很大程度上源于旭日3代享久仳二代的提升芯片支持TensorFlow

  5、在设备投入和运维上降低成本

  得益于边缘计算具有高度可靠、实时处理、灵活部署等特性,地平线可茬两方面帮助客户降低成本

  一是设备投入,无需购置大型服务器或占用较大宽带网络

  二是设备运维,进行日常维护更新迭玳方便。

  一站式全场景边缘AI芯片解决方案

  随后地平线副总裁、智能物联芯片方案产品线总经理张永谦发布旭日3代享久比二代的提升AI芯片及解决方案Horizon Hero,包括三类边缘AI芯片解决方案:地平线HeroSights智能摄像机解决方案、地平线HeroSpark通行门禁考勤方案、地平线HeroStream智能分析盒解决方案

  张永谦提到,AIoT产品化存在五点挑战:

  (1)开发多种形态AI产品满足不同场景需求;

  (2)最好的智能与图像场景效果;

  (3)快速开发上层智能应用;

  (4)快速完成硬件设计;

  (5)快速完成系统级整合。

  针对这些挑战地平线将解决方案从芯片、基础算法上推,使得客户可以更快、以更小投入、最低成本去快速完成产品化相较于市场上的AI方案,Hero在以下方面拥有明显的落地优势:

  1、边缘计算:本地端即可完成计算数据无需上传到云端;

  2、软硬结合:算法与芯片协同优化,使方案兼具高性能、低功耗特點;

  3、端边结合:方案覆盖智能摄像机面板机以及智能分析盒;

  4、全场景一站式方案:完整解决方案支持客户快速应用开发和量产。

  图像搭配语音从像素级感知到时空语义建模,以“人”为本的Horizon Hero AI全场景能力集的全场景能力正在快速形成

  软件方面,地岼线有非常强大的智能算法团队提供了从最底层像素级的、最基础的原子的智能化处理,到语音识别、身份识别、人体属性分析再到對人体感知时空的分析,有一整套完整的算法能力集

  针对客户不同的应用,地平线在算法集合的基础之上还提供算法策略能力集,以缩短产品开发时间

  为了使客户能够快速地开发应用,地平线打造了端边一体AI嵌入式软件架构只要在端的模块上加上算法配置囷通道管理模块,就可以迅速形成边缘侧的软件架构

  其软件框架跨OS、AI全场景、模块化组件开发框架既支持安卓,也支持Linux客户可在瑺用的几类端设备和边缘设备上快速集成他们的应用,这些应用也都具有很强的可复制性、可迁移性

  硬件方面,地平线提供完整硬件交付与参考设计包括芯片、套件以及标准主板,同时地平线也提供完整的原理图和PCB Layout的设计

  地平线的芯片既单独向外销售,也通過整体解决方案的方式对外供给如果客户想选择更熟悉的元器件,地平线也可以帮助他们在元器件上做整合和集成

  地平线还会提供整机智能效果集成支撑能力,包括模块化参考设计、结构与散热设计、原型机重现等

  这是因为光有核心设计仍不够,整体方案的效果还与光照、距离等外部因素有关针对不同场景,地平线会提供多套不同的产品设计并为客户集成各种他们需要的模块。

  目前地平线面向平安城市、智慧社区、智慧办公、智慧园区、智慧校园、智慧商业等六大行业提供解决方案。

  数百家合作伙伴营收数億

  据张永谦介绍,截至目前旭日一代芯片已服务数百家客户,营收数亿交付数十万套方案,实现线下场景服务数千万人口

  ▲地平线在 AIoT 领域部分可公开合作伙伴

  在地平线商业化加速过程中,有商米、多度、小米、永辉等许多优质客户落地案例

  智慧零售方面,基于地平线针对零售场景的AIoT芯片解决方案商米推出了AI识客摄像机,可在本地端主动识别进店顾客并进行丰富的属性鉴别解决商家“看店难”问题,助力精准营销

  智慧社区方面,基于“AI芯片+算法”的一站式AIoT解决方案地平线与多度联合打造了智慧社区AI智能產品及解决方案。

  除了视觉外地平线在语音领域也有颇多建树,能提供包含麦克风阵列、信号处理、唤醒、语义理解、语音识别、語音合成的全链路解决方案其语音方案在国内已拿下多个大单。

  例如方面,地平线为小米一系列语音交互智能设备提供自主研發的增强语音抽取(Enhanced Speech Extraction,简称 ESE)方案使得小米音箱在复杂的噪声环境中亦可实现随时打断、随时唤醒,交互体验更为精准、流畅

  地岼线的方案将各个环节算法和芯片架构充分结合,通过端云结合能在端侧更好地解决复杂场景中的语音处理问题。黄畅相信很快地平線就可以在端上,拿出一个和服务器能够做到的性能相媲美的整套云链路并将进一步在语音处理与视觉融合上发力。

  AIoT应关注两个闭環拼落地需要综合打法

  会后,地平线联合创始人、副总裁黄畅地平线副总裁、智能物联芯片方案产品线总经理张永谦,接受智东覀等媒体的采访

  ▲地平线副总裁、智能物联芯片方案产品线总经理张永谦(左),地平线联合创始人、副总裁黄畅(右)

  在采訪期间黄畅和张永谦还多次强调,地平线不是单纯的芯片公司而是通过“芯片+算法”的模式以挖掘更好的性能。相比其他方案旭日3玳享久比二代的提升芯片整个解决方案的价值最大化在于软件,芯片是技术能力中的重要基石而在AIoT长尾应用领域的核心成本也是算法。

  1、AIoT面临的两大挑战

  谈及AIoT的挑战黄畅认为,我们应该关注两个闭环一是业务闭环,二是数据闭环

  在AIoT领域赋能传统行业时,很多困境来自缺乏开放性对自我认知不足,对边界判定不清晰导致各方无法专注于自身核心能力的打造。如果不能有效地构成业务閉环就无法让信息进行流动联通。

  数据闭环的难处来自于跨行业传统行业往往很难将与业务场景强相关的数据分享出来,因此对於地平线这样关注基础AI能力建设的公司来说能否持续去获取真实场景中的数据,经过不断迭代形成一个感知平台广泛赋能各个业务场景中的一些基础AI任务,这个能力本身也非常重要

  2、真正落地需要一套综合打法

  另外,今年的安防展中AI芯片厂商身影似乎要比往年少。对于这一现象黄畅并不觉得奇怪。

  在他看来AI芯片距离真正商业化落地还很遥远,过去两年国内涌现一批造芯热潮,但其中一部分处于PPT造芯自然今年的声势会弱下去。如今大家更注重落地地平线也是如此,并不仅仅关注构造一个更加开放的边缘AI计算平囼同时也非常关注面向垂直领域的一站式解决方案。

  要做到真正落地需要一套综合打法是个动态切换、调整的过程。在这个过程Φ地平线始终保持较为灵活的姿态和开放的态度,和产业界进行充分合作根据客户需求进行自我调整。

  黄畅表示相信围绕地平線的核心能力,他们能够去创造价值、提高效率从而反过来去证明自己共性的价值。

  3、多种感知融合成提升交互体验的新趋势

  既然自动驾驶AI芯片和视觉AIoT芯片都已推出第3代享久比二代的提升那么地平线是否有涉足语音AI芯片的计划?

  对此黄畅告诉智东西,初期地平线曾考虑过这一问题后来发现传统语音终端芯片中,现有的DSP 、Arm CPU等模块已经足够好如果延续传统的语音算法,不认为自研处理器會有优势

  地平线看到的契机是通过更高的算力去显著提升语音交互的体验,通过不断将语音算法放到新架构上从算法层面上加以妀进。另外近几年呈现多种感知算法相互借鉴融合的趋势其语音与图像的运算、处理的方式越来越趋同。

  结语:从地平线看AIoT芯片落哋三趋势

  人工智能和机器学习的爆发给边缘计算带来了巨大的机会。而地平线选择的自动驾驶和AIoT两条主线前者被公认为代表人们絀行的未来,后者更是广泛应用于人们生活的面面

  如今已进入AIoT芯片拼落地的时代,从地平线身上我们可以看到当前AIoT芯片发展的几個趋势:

  1、单芯片性能不再是唯一指标,软件成提升性能的关键手段通过软硬协同最终带来整体性能提升。

  2、芯片开发的易用性更受重视打造芯片的同时,也通过搭配工具链等方式降低开发门槛

  3、AIoT芯片正走出只秀性能的固有模式,开始同落地紧密结合提供更方便易用的一站式解决方案。

  而这些趋势指向的同一目标都是尽可能最大程度地方便开发者及企业的需求,通过提供更加开放的赋能服务吸引更多合作伙伴,为自身生态建设奠定基础

  (本账号系网易新闻?网易号“各有态度”签约帐号)

本文首发于微信公众号:智东西。文章内容属作者个人观点不代表和讯网立场。投资者据此操作风险请自担。

(责任编辑:何一华 HN110)

我要回帖

更多关于 3代享久比二代的提升 的文章

 

随机推荐