作为年度的盛会,NVIDIA GTC China一直在引领技术的浪潮。今年的GTC China把会议地点放在了苏州,而不是往届的北京,或许是希望传递出NVIDIA一直在引领变革的决心。作为压轴大戏,NVIDIA创始人兼首席执行官黄仁勋的主题演讲在众人的期待中拉开帷幕。在这次历时两个多小时的演讲中,黄仁勋为我们带了诚意满满的“干货”。黄仁勋的主题演讲分为三个部分,分别从计算机图形技术、加速计算和自动机器人三个方面系统介绍了NVIDIA的最新成果。
Turing架构重塑计算机图形黄仁勋表示,NVIDIA GPU彻底改变了实时计算机图形技术,让很多应用成为了可能。十年磨一剑,Turing正在引领计算机图形技术实现新一轮的突破。
据悉,革命性的NVIDIA Turing架构结合全新的GeForce RTX平台,将实时光线追踪、人工智能和可编程着色技术融于一身,带来全新的游戏体验方式。光线追踪可提供接近现实体验的光照、反射和阴影等效果,营造的画面逼真度远超过传统渲染技术。而搭载Tensor Core,Turing架构可提供AI计算性能,其可以实时运行强大的AI算法,打造难以置信的清晰明快、栩栩如生的画面和特效。
黄仁勋在大会现场上展示了采用RTX技术的游戏产品——中国第一款RTX游戏《逆水寒》,“Turing拥有巨大的算力和三个处理器:着色器、光线追踪引擎以及Tensor Core处理器,这样我们就能够打造特效,并且渲染以前不可能实现的图形,比如说倒影、阴影。”黄仁勋说。
例如Turing架构搭载了DLSS(深度学习超级采样)功能。DLSS是一个运行在Tensor Core上面的神经网络模型,通过这个模型训练可以把一个图像做得更美。我们为其输入一个图像,这一图形可能是低清晰度的,正是因为经过DLSS多次训练,对图像进行强化,让它变得更美观。
从Turing架构的问世,我们可以看到NVIDIA在计算机图形技术方面的投入是不遗余力的,毕竟这是NVIDIA赖以生存的根基。Turing架构在游戏开发、消费级领域等更多细分领域应用之后,我们也许才能了解NVIDIA在GeForce品牌的战略布局。
加速计算引领未来当前计算产业面临历史的转折点,以CPU为代表的摩尔定律渐渐“力不从心”,于是GPU、FPGA等异构计算兴起,特别是以GPU为代表的加速计算成为当前的热点。
在黄仁勋看来,整个社会对计算力的需求持续增加,但是摩尔定律却进入到了停滞期。我们彻底改变计算方式,于是NVIDIA展开了先驱性的工作,即“加速计算”。现在整个业界已经对加速计算非常熟悉,不管是在超算还是HPC等领域。
NVIDIA还对应推出了CUDA平台。事实上,英伟达在推出CUDA的数年时间中,已经为众多关键应用程序加速了1000倍以上。而NVIDIA也不断迭代CUDA,加入更多功能。截至目前,NVIDIA CUDA SDK下载量已经接近1400万,其中去年一年就贡献了600万。“CUDA不断为开发者赋予活力,这就形成了非常正能量的反馈系统,基于CUDA的应用生态不断壮大。”黄仁勋说。
在SC18高性能计算大会上公布的全球最快超算TOP500排行榜中,采用NVIDIA GPU加速器的系统数量在一年内增长了48%。总数由一年前的86个增加至127个,是五年前的三倍。
此外,全球最快的两台超级计算机——美国能源部橡树岭国家实验室的Summit,以及劳伦斯利弗莫尔国家实验室的Sierra,也都采用了NVIDIA GPU作为其算力核心。这两大系统共计采用了超过40000个NVIDIA V100 Tensor Core GPU,助力全球领先的研究人员开展开创性的研究。
而且在人工智能的浪潮中,NVIDIA也不会缺席,相反其发挥了更为举足轻重的作用。黄仁勋表示,AI人工智能让机器通过大量数据自主学习、编写软件,甚至是探索人类不曾想象过的可能性。
借助AI,行业可以从海量数据中学习建立预测模型,并将这些模型应用到行业应用场景中。数据越多,训练强大AI模型的能力就越强。电商、零售、金融服务、电信、医疗保健等正在成为数据驱动的AI行业,他们可以基于此进行业务优化。
人工智能将会改变未来计算,改变计算的使用、以及计算如何被设计。未来,数据科学家和科学计算融合在一起,深度学习和科学计算融合在一起,机器学习和仿真融合在一起。超级计算机的作用会越来越重要,计算力的获取也会更加多样性。在GTC China 2018上,黄仁勋宣布了NVIDIA HGX-2和T4两个新产品。
HGX-2由NVIDIA的16个高端V100 GPU组成,使用NVSwitch高速互联总线将16个GPU完全连接为一个整体来使用,其能在单节点中提供2PFLOPS计算性能。
作为云服务器平台,HGX-2具备多精度计算能力,支持面向科学计算和模拟的高精度FP64和FP32计算,也支持AI训练和推理所用的FP16和INT8精度。与仅使用CPU的服务器相比,它将AI机器学习工作负载的运行速度提升近550倍,将AI深度学习工作负载的运行速度提升近300倍,将高性能计算工作负载的运行速度提升近160倍。
黄仁勋提到,浪潮是中国首家构建HGX-2服务器的厂商,浪潮AI超级服务器AGX-5专为解决当前AI深度学习和高性能计算的性能扩展难题而设计。此外,包括百度、腾讯、阿里巴巴在内的诸多客户,也在借助HGX-2为内部应用及云客户提供一系列更强大的AI服务;联想、华为、曙光也已宣布成为HGX-2云服务器平台的合作伙伴。
紧接着,黄仁勋还介绍了NVIDIA T4。T4基于全新NVIDIA Turing架构,采用多精度Turing Tensor Core和全新RT Core,与加速的容器化软件堆栈相结合,打造成一个超大的人工智能处理系统。凭借其强大的加速能力,百度、腾讯、京东和科大讯飞将开始使用Turing云GPU加速超大规模数据中心;浪潮、联想、华为、曙光、浪潮商用机器和新华三均宣布推出基于全新T4的服务器。
NVIDIA产品管理资深总监Keith Morris表示,对于NVIDIA来说,在云计算方面秉持两个策略——向上扩展,与百度、腾讯等合作伙伴打造高性能的系统,解决一些为数不多的大的问题。比如:人工智能方面的问题;横向扩展,NVIDIA T4可以实现大规模的数据中心部署,方便云计算提供商采用服务的形式面向用户提供AI能力。
除了硬件产品,NVIDIA还推出了开源的GPU加速平台RAPIDS,该平台于今年10月发布,是一款针对数据科学和机器学习的GPU加速平台,为数据科学工具链带来了GPU提速。据介绍,平安科技、华大基因等已经使用RAPIDS加速工作负载,并取得了不错的效果。
NVIDIA全球市场运营执行副总裁Jay Puri表示,NVIDIA聚焦于“打造计算的未来”,从高性能计算到人工智能,我们要把人工智能带到每一个行业。人工智能确实能够惠及各行各业,从交通、医疗到金融、服务及零售,它能够为人们带来更加美好的生活、提高服务质量、减少浪费,提高各国的生产力。“NVIDIA提供的是一个计算平台,而遍布各国的开发者、研究人员,还有科学家,他们会把各种各样的应用带到这个计算平台之上,我们共同打造一个自由的、开放的平台或者说未来。”
NVIDIA全球副总裁、中国区总经理张建中补充说,NVIDIA对于人工智能、深度学习是比较乐观的,也有相应的解决方案给到行业用户,相关业务发展迅速。“很多互联网公司,包括头条、美团、小米等等,以及电信、金融等领域都是开始在数据中心采用我们的产品。所以我们对今年和明年国内的数据中心业务发展是非常乐观的。”
自主机器实现世界的自动化在自主机器方面,NVIDIA推出了Jetson AGX Xavier AI计算平台。Xavier是世界首个用于自主机器的AI计算平台,在Xaiver基础上,NVIDIA打造了一个全新的产品家族DRIVE AGX。此外,Jetson AGX Xavier平台还配备了NVIDIA JetPack SDK。这套完整的AI开发软件解决方案,涵盖了最新版本的CUDA、cuDNN和TensorRT,以及用于简化并加速开发的高级软件代码。目前,汽车制造商、电商巨头等都在基于NVIDIA Jetson AGX Xavier进行自动驾驶、机器人等应用的探索。
对于自动驾驶的拓展,NVIDIA自主机器全球副总裁Rob Csongor表示,NVIDIA是从芯片切入,而计算对于自动驾驶至关重要,基于此可以实现纵向集成,NVIDIA可以提供端到端的整体解决方案。
结语“放眼未来的市场竞争格局,整个行业正在快速变化当中,人工智能从根本上推动了这个改变。NVIDIA把人工智能融入了各个产品,推动整个行业的变革。”黄仁勋最后说。