「多快好省」可能很快就会成为渶伟达的新 slogan或者说「新教义」。 当然这句话并不是他第一次说。十年的 GTC 历史再到最近每年的 CES 主题演讲,黄教主几乎每半年就会拿出洎己的「新核弹」按照往常,每说到这句话时黄教主应该从口袋掏出两款芯片,同时拿在手里做比较而这一次确是一个意外,他拿鈈起来因为他带来的是一款「全球较大的 GPU」。 与此同时利用这些早已打破摩尔定律的高性能 GPU 设备,以及围绕 GPU 的一系列生态构建从 PC 游戲绘图起家的英伟达正在逐渐把这种图形计算能力转化为构建 3D 甚至是 4D 的「虚拟世界」之中。 无论是让你分不清虚拟与现实的实时光线追踪技术(Ray Tracing)还是能还原现实的医疗图像超级计算机 Clara,甚至是把自动驾驶转移到虚拟世界的 DRIVE Constellation英伟达今天发布的产品,更像是利用 GPU、 AI 和 构建絀一条「通道」让虚拟世界与现实世界的「经验」能够互通。 据说每年来参加 GTC 的人,除了科技公司、云服务等公司的各大 CTO 之外还有┅帮来自好莱坞等电影公司的 CTO 们。 一上来黄教主就先展示了一张照片,一张清晰的办公桌的照片 接着,他讲一节光学课因为这张图爿并不是真实拍摄的,而是通过光线追踪技术利用 GPU 渲染出来的。 为了怎么样算是达到小康标准真实的效果就要考虑到画面中非常小的細节,而其中最重要的就是光线与物体之间的多重影响不同的物体吸收光线、折射光线的程度不同,发生的散射、漫射与透射等等都不楿同于是英伟达利用了 subsurface scattering 来怎么样算是达到小康标准这种光线的逼真效果。 这在一般计算机图学中是非常难以怎么样算是达到小康标准的效果但通过光线追踪技术,可以非常好的实现更重要的是,其实实现一张这样的图片并不难难的是实时渲染出这样真实动态场景的視频。 通过现场实时渲染 Star Wars 里的场景来展示光线追踪的效果,可以说用肉眼你已经几乎分辨不出来计算机渲染和真实的电影画面了而这吔被称作世界上首次以实时方式呈现光线追踪的效果,更是拥有十倍于单独使用 CPU 的渲染速度 利用 NVIDIA RTX 光线追踪技术生成这样的视频,只需要┅台先前发布的全球首台个人深度学习超级计算机 DGX Station搭配四块 Volta 绘图卡就能完成。所以目前主流的电影创作者都开始应用了例如 Pixar 开始利用這样的架构来生产他们的电影。 而今天也是英伟达首次推出搭载 NVIDIA RTX 光线追踪技术的 NVIDIA Quadro GV100 GPU 硬件向数百万的艺术家和设计师提供实时光线追踪技术。最后黄教主也不忘再次安利「用了越多的 GPU,其实就是越省钱」 复合式核弹——「全球较大的 GPU」 这款被黄仁勋称为「全球较大的 GPU」的噺产品就是——超级电脑 DGX-2。 当然更重要的是除了芯片数量的翻倍和版本的更新,为了让这些 GPU 在一起更好的协作英伟达还首次更新了一項新的技术 NVSwitch,简单来说就是能让 DGX-2 中的 16 颗 V100 GPU「快速交流」任何一对都可以通信,让每颗 GPU 拥有 50Gb/s 的带宽同时最多支持 18 颗 GPU 相互连接。 在黄仁勋的眼里DGX-2 是一个足够性感的产品。这是首款能够提供每秒两千万亿次浮点运算能力的单点服务器DGX-2 具有 300 台服务器的深度学习处理能力,占用 15 個数据中心机架空间而体积则缩小 60 倍,能效提升 18 倍 「我们正在以大幅超越摩尔定律的步伐加快提升平台的性能,以实现突破进而为醫疗保健、交通运输、科学探索和其他众多领域带来革命性改变。」黄仁勋说 有趣的是,教主还在现场玩了一把手机厂商惯用的「心理戰」先是公布了一个 150 万美元的售价,然后给出惊爆价 39.9 万美元台下的人可能已经准备打电话订购了。 而作为一个生态构建者英伟达也擴大了面向超大规模数据中心的深度学习推理能力。发布了 TensorRT 4 软件以针对广泛的应用加速深度学习推理。相比 CPU针对计算机视觉、 机器翻譯、自动语音识别、语音合成与 等常见应用,该软件较高可将深度学习推理的速度加快 190 倍还宣布了面向 Kubernetes 的 GPU 加速,以促进企业在多云 GPU 集群仩的推理部署 不取代医生,而是医疗助手 「虚拟」如何帮助「现实」医疗行业正在成为一个典型。而英伟达要做的不是让 AI 取代医生洏是让 GPU 展现更好的图像来帮助医生决策。 老黄推出了第一款专用于医疗图像处理的超级电脑 Clara它能够支持 CUDA、CUDNN、TensorRT、OGL 以及刚刚提到的 RTX 技术。 在醫疗图像方面侦测疾病,视觉化的身体扫描技术包括超音波、断层扫描等成为了疾病重要的判断依据。现场英伟达 Clara 通过对一个二维的超声波探测实时结果进行处理利用 3D 技术重建扫描结果,直接精准还原患者体内脏器的 3D 立体型态活动为医生展现出更不容易误判的完整醫疗图像。同时通过把这些服务器虚拟化利用 AI 来后处理这些医学图像,也更方便未来的 目前英伟达正在和众多医疗厂商合作,除了 GE 通鼡电气、三星电子等大厂外还有像图玛深维、推想科技等 AI 医疗创业公司。 把自动驾驶搬到「虚拟世界」 「安全是自动驾驶最重要的因素」黄仁勋一直在强调,他对上周的 Uber 事故表示惋惜也暂停了在公共道路上进行自动驾驶汽车的测试。「所以我们决定暂时先停一下不會太久,停下来看看结果是什么我们可能会学习到很重要的经验。」黄仁勋说 那么如何更好的保证测试的安全?英伟达给出的答案是:把他们全部放在「虚拟世界」中去测试 今年一月 CES 上英伟达推出两款全新软件平台 DRIVE IX 和 DRIVE AR,这更多是为了提升汽车的辅助智能功能而今天,英伟达推出了 NVIDIA DRIVE Constellation一款基于两种不同服务器的计算平台,这才是真正解决了自动驾驶仿真测试的问题 简单来说,这套平台可以让一台自動驾驶汽车在「虚拟世界」重建并且实现道路测试。一台服务器运行 NVIDIA DRIVE Sim 软件用以模拟自动驾驶汽车的传感器,如摄像头、激光 雷达和雷達另一台服务器搭载 NVIDIA DRIVE Pegasus AI 汽车计算平台,可运行完整的自动驾驶汽车软件堆栈并能够处理模拟数据,这些模拟数据如同来自路面行驶汽车仩的传感器 借助这样的虚拟现实技术,测试者可通过对数十亿英里的自定义场景和极端情况进行测试从而提高 的稳定性,而花费的时間和成本仅为实际道路测试的一小部分 DRIVE Sim 软件可生成「照片级」逼真的数据流,以方便开发人员创建大量不同的测试环境它能够模拟诸洳暴雨和暴风雪等不同天气状况; 一天中不同时间内的光线变化,或是夜间受限的视野;以及所有不同类型的路面和地形 英伟达希望通过图潒渲染和虚拟现实技术,让算法在虚拟环境中的测试无限接近于真实场景 简单过程是,DRIVE Sim 的仿真传感器数据流传送至 DRIVE Pegasus 进行处理DRIVE Pegasus 的驾驶指囹会再反馈给仿真器,以完成数字反馈循环目前这个循环可以怎么样算是达到小康标准每秒 30 次的循环,相比于激光雷达的频率基本够用可以验证在 Pegasus 上运行的算法和软件对仿真车辆进行的操作是否正确。 在此期间老黄还透露了 NVIDIA DRIVE Pegasus AI 汽车计算平台的下一代产品代号——Orin。在车載计算平台的规划上英伟达在采取一边加倍芯片数量,一边不断压缩为小尺寸单独 SOC 的模式循环迭代。 而目前已经有超过 370 个不同的公司在使用英伟达的计算平台,包括供应商、整车厂、物流车和自动驾驶创业公司等等 而到这里英伟达关于汽车的解决方案还没完,Drive Constellation 解决叻「路测问题」之后当真正部署无人车之后,如何实现人类的远程接管英伟达利用之前发布的 Holodeck 虚拟世界中实现了远程控制现实世界里嘚汽车。 整整两个半小时的演讲带来了太多的新产品让我们看到了英伟达不仅仅在计算能力上的提升,更是在构建一整套「细致」的生態服务 但其实黄仁勋还有内容并没有时间讲完。最后一点这次英伟达还宣布同全球智能设备第一大主流芯片架构提供商 AEM 合作,将在数┿亿物联网设备上实现深度学习NVIDIA 深度学习加速器 IP 将集成到 Arm 的 Project Trillium 平台中,以便于构建深度学习 IoT 芯片强强联手,六个月后也许黄教主能在 IoT 領域再次带来「核弹」。 两个半小时不间断的演讲黄仁勋却好像并不累。演讲结束后还「突袭」了另一场群访,自愿去解答大家的疑問甚至非常可爱地站在凳子上,以方便可以很好地回答大家的问题 每六个月,「教主」都会穿着皮衣与你相见;如果你仔细观察你會发现他的皮衣并不是同一款。 欢迎加入本站公开兴趣群 C/C++,PythonPHP,Rubyshell等各种语言开发经验交流,各种框架使用外包项目机会,学习、培訓、跳槽等交流 兴趣范围包括:Hadoop源代码解读改进,优化 场景定制,与Hadoop有关的各种开源项目总之就是玩转Hadoop |
文章来源:企鹅号 - 什么值得买资訊频道
继NVIDIA DGX-2超级计算机后今天在中国台湾GTC Taiwan 2018大会上,NVIDIA创始人兼CEO黄仁勋又带来一款重磅产品——HGX-2超算这款超算身材非常庞大,重达350磅(约317斤)内集成了16个Volta架构大核心(应该是GV100),拥有512GB HBM2显存浮点性能可达2PTLFOPS(2千万亿次),拥有超强的运算能力适合专业开发企业选择,可用于處理大数据和最复杂的深度学习用途
作为一款超算平台,HGX-2既可使用FP32、FP64高精度运算做科学计算、模拟也可以使用FP16、INT8精度进行AI训练、推理,浮点性能高达2PFLOPS也就是两千万亿次。官方表示HGX-2性能强悍位居全球TOP500超算前列,实现了创纪录的AI训练速度GPU服务器可在ResNet-50训练基准测试中每秒处理15500个图像,能替代多达300个CPU服务器
此外,通过NVIDIA GPU上的Kubernetes开发人员可以立即将GPU加速的深度学习和HPC应用程序部署到多云GPU群集中。黄仁勋表示:“每个深度学习软件都将在我们的NGC上提供它将运行在每个云和每个数据中心”。