2018年11月21日,NVIDIA在苏州举办了GTC China大会。大会上,NVIDIA创始人兼首席执行官黄仁勋在两个多小时的主题演讲中为我们分享了NVIDIA对于AI时代的思考以及众多新产品、新技术和新服务。
NVIDIA HGX-2 GPU加速平台获得广泛采用NVIDIA在大会上宣布其HGX-2服务器平台已经被广泛应用,这是全球最强大的加速服务器平台,适用于AI深度学习、机器学习和高性能计算。目前,NVIDIAHGX-2GPU加速平台已经获得众多厂商支持,包括百度、腾讯借助HGX-2构建更强大的AI服务;浪潮、联想、华为和曙光推出基于全新HGX-2的服务器。
HGX-2能够提供无与伦比的计算性能。HGX-2具备NVIDIA NVSwitch互联结构等突破性功能,将16个NVIDIATesla V100 Tensor Core GPU无缝连接到一起,形成一个巨型GPU,能够提供2千万亿次的AI性能。HGX-2还具有0.5TB内存和16TB/s总内存带宽。
HGX-2云服务器平台具有多精度计算能力,可提供无可比拟的灵活性以支持未来计算。该平台融合了高精度FP64和FP32,可实现精确高性能计算;同时也融合了更快速的低精度FP16和INT8,可实现深度学习和机器学习。
NVIDIA的HGX-2在单节点中能够提供2千万亿次的计算性能,与仅使用CPU的服务器相比,它将AI机器学习工作负载的运行速度提升近550倍,将AI深度学习工作负载的运行速度提升近300倍,将高性能计算工作负载的运行速度提升近160倍。
全球领先的科技公司正在利用HGX-2创纪录的性能,在GTC China上最新采用的发布包括:
百度和腾讯将借助HGX-2,为内部应用及云客户提供一系列更强大的AI服务。
浪潮是中国首家构建HGX-2服务器的厂商,浪潮AI超级服务器AGX-5专为解决当前AI深度学习和高性能计算的性能扩展难题而设计。
联想、华为、曙光也已宣布成为NVIDIA HGX-2云服务器平台的合作伙伴。
先前宣布支持和采用HGX-2的企业均为全球领先的服务器制造商,包括富士康、英业达、云达科技、广达电脑、超微、纬创和纬颖。此外,甲骨文上月宣布其计划为甲骨文云基础设施部署NVIDIAHGX-2平台,并将采用裸机和虚拟机两种实例,便于顾客轻松访问统一的HPC和AI计算架构。
NVIDIA副总裁兼加速计算总经理IanBuck表示:“中国领先的科技公司正在迅速利用史上最强云节点HGX-2,借助HGX-2无与伦比的计算能力和通用性设计,中国以及全球各地的公司现在能够构建全新可扩展的产品和服务,以解决巨大的计算难题和当今一些最紧迫的问题。”
NVIDIA Turing T4云GPU持续强势加速NVIDIA在大会上宣布,NVIDIA Turing T4云GPU继续强势加速,几家科技巨头正在推出基于全新NVIDIA T4 GPU的新产品和服务,它已成为普及最为迅速的一款服务器GPU。
搜索、社交媒体和在线购物网站等互联网公司是T4的早期使用者,也是最大的终端客户群。中国首批开始使用T4扩展并提升工作负载横向扩展的企业包括百度、腾讯、京东以及科大讯飞。中国领先的计算机制造商也将推出一系列基于T4的服务器,包括浪潮、联想、华为、曙光、浪潮商用机器和新华三等。
此前NVIDIA曾在上周宣布,T4在仅推出2个月后,即在全球领先的计算机制造商的57种独立服务器设计中发挥重要作用。此外,谷歌云宣布谷歌云平台客户可以使用T4。
NVIDIA副总裁兼加速计算总经理IanBuck表示:“中国采用T4的速度之快并不令人意外,以前我们从未推出过这样的GPU,为公共云和私有云提供所需的综合性能和能效,可大规模、更经济地运行计算密集型工作负载。并且,中国的市场‘规模’无可比拟,我们预测T4将非常受欢迎。”
T4基于全新NVIDIA Turing架构,采用多精度Turing Tensor Core和全新RTCore,与加速的容器化软件堆栈相结合,提供规模空前的性能。
T4旨在满足横向扩展的公共云和企业云环境的独特需求,最大限度地提高吞吐量、利用率和用户并发性,帮助客户高效应对用户及数据爆炸式增长的问题。
小巧的70瓦特T4 GPU大致相当于一条巧克力糖的大小,可灵活适应于标准服务器或任何开放计算项目的超大规模服务器设计。服务器设计的范围可从单个T4 GPU直至单节点中的20个GPU。
T4的多精度功能可支持4种不同精度等级的各类AI工作负载,助力实现突破性的AI性能,FP32精度能够提供8.1TFLOPS,FP16精度能够提供65TFLOPS,INT8精度能够提供130TOPS,INT4精度能够提供260TOPS。针对AI推理工作负载,配备2个T4GPU的单个服务器最多可取代54台CPU服务器。针对AI训练,配备2个T4的单个服务器可取代9台双套接字CPU服务器。
NVIDIA推出NGC-Ready系统NVIDIA在上周发布了NGC-Ready计划,让采用基于NVIDIA GPU的强大系统的客户能够在更广的范围内放心地部署GPU加速软件。在GTC China 2018大会上,NVIDIA发布了更多来自中国领先计算机制造商的全新NGC-Ready系统,包括:华为FusionServer G560 V5、浪潮NF5468M5、联想ThinkSystem HG690X、曙光X795-G30。
除上述系统外,ATOS、思科、Cray、戴尔EMC、HPE和超微等此前也已发布了NGC-Ready服务器。
此外,搭载NVIDIA Quadro GPU的NGC-Ready 工作站将为研究人员提供一个平台,为其提供快速构建、训练及开发深度学习项目所需的性能和灵活性来自多家工作站厂商的NGC-Ready系统包括:HPI Z8和联想ThinkStation P920。
NGC容器与顶级供应商的NGC-Ready系统相结合,让用户能够以一种具有可重复性、容器化的方式,在从开发到生产的整个过程中运行加速应用。
NGC容器注册中的容器可在其他多种平台中运行,包括阿里云、Oracle云基础设施、NVIDIA DGX系统、以及特定型号的NVIDIA TITAN和Quadro GPU。
NGC容器现已供免费下载。
电商巨头选用NVIDIA Jetson AGX Xavier打造下一代配送机器人在GTC China 2018上,NVIDIA宣布电商公司京东和美团已选用NVIDIA Jetson AGX Xavier平台,为其下一代自主配送机器人提供技术支持。
在过去的几十年中,中国占据了全球40%以上的电商交易——每年约为千亿美元。根据麦肯锡全球研究院的数据,这一数字已经高于法国、德国、日本、英国和美国的总和。
为了支持这一巨大的增长,中国领先的电子商务公司正在开发人工智能配送机器人,使货物在仓库之间运送,加快最后一英里的配送速度,并将产品交付给消费者和企业。
下一代配送机器人的需求下一代配送机器人需要在小型封装中实现大规模计算性能。包括多个高分辨率摄像头和激光雷达等的各种传感器必须感知周围世界,在复杂、动态的城市环境中进行本地化地路径规划和行驶。它们需要实时识别行人、汽车、交通信号灯、标志和其他物体并做出反应。
Jetson AGX Xavier非常适用于此类场景。它具有高性能和高能效,能够实时处理所有这些计算任务,让配送机器人能够安全地自主执行操作。该模块能够以每秒高达32万亿次的操作速度,提供强大工作站般的处理能力,其能效比其前代产品高出10倍,而尺寸仅有手掌大小。
由于配送机器人等自主机器是由软件定义的,因此通过更新可轻松提高性能并添加更多功能。Jetson AGX Xavier平台配备了NVIDIA JetPack SDK,这是一套完整的AI开发软件解决方案,包括最新版本的CUDA、cuDNN和TensorRT,以及用于简化并加速开发的高级软件代码。
京东通过社区自主移动货物京东是中国最大电商公司,拥有3亿活跃客户,是中国最大的内部电子商务物流网络,覆盖99%的人口。它是全球首家推出全自主B2C配送中心和商用无人机配送的电子商务公司。为了满足日益增长的配送需求,京东去年开始在大学和商业园区试行自主配送机器人。
京东的配送机器人配备了多个与Jetson AGX Xavier连接的高清传感器,提供360度的实时视觉和感知处理,以充分感知环境的态势。通过这种方式,配送机器人可以轻松地在拥挤的街道上穿行,自主规划路线,避开障碍物,并识别红绿灯。
京东机器人开发首席科学家孔旗表示:“我们的配送机器人需要一个具有强大计算能力、能够与各类传感器连接的平台,以便在户外的动态和非结构化环境中安全地行驶,并与人类进行交互。这就是我们选择Jetson AGX Xavier的原因,它是首款适用于自主机器的平台。”
美团通过AI实现食物运输美团点评是全球最大的按需食品配送公司,结合了Uber Eats、Yelp和Groupon的商业模式,与超过40万家本地企业开展合作。他们推出了小袋自动配送车,能够将餐食从餐馆运送到消费者手中。
小袋正在三处地点进行测试,包括北京朝阳大悦城、联想深圳办公室、以及雄安新区。
虽然配送车及其电池的尺寸较小,但传感、定位和路径规划所需的处理量与大型无人驾驶车辆相同,且很大程度上依赖于Jetson AGX Xavier的高性能计算。
美团总经理夏华夏表示:“无人配送车对物流业发展至关重要,能够大大改善分发和配送。我们期待利用Jetson AGX Xavier强大的AI功能来提升小袋自主配送机器人的功能。”
NVIDIA Jetson AGX Xavier开发者套件现已上市,售价为1299美元。
自动驾驶汽车选用NVIDIA DRIVE AGX除了机器人,自动驾驶技术正在带动一场交通运输业的革命——从个人旅行到物流和配送——这一变化在中国这一全球最大的汽车市场中更加明显。在GTC China 2018上,新贵汽车制造商、货运公司和领先的供应商为其即将推出的自动驾驶系统平台选用NVIDIA DRIVE AGX。Xavier是完全汽车级别芯片,目前正在生产中。通过选择在他们的汽车上安装高性能、高能效的NVIDIA DRIVE AGX Xavier计算系统,这些公司正朝着一个安全的交通环境努力,并为未来的道路建立强有力的合作伙伴关系。
自动化近在眼前随着电子商务带动全球货运需求并加剧卡车司机短缺的形势,自动驾驶预计将成为物流业的一大福音。在中国每天的生活中,卡车都在高速公路上运送多达8400万吨的货物,为中国3000万卡车司机带来越来越大的压力。为助力加速其发展,中国的运货公司正在采用NVIDIA DRIVE AGX,以提供无人驾驶车辆所需的计算性能。
一汽集团(FAW Group)是中国最大的卡车制造商之一,正在与自动驾驶初创公司智加科技(PlusAI)和物流公司满帮集团(Full Truck Alliance,FTA)合作开发无人驾驶商用卡车车队,计划于2021年进行大规模部署。本周,这些公司表示将采用运算能力高达每秒320万亿次的AI超级计算机NVIDIA DRIVE AGX Pegasus,为其即将推出的自动驾驶卡车的运行提供支持,并加速中国长途运输行业的升级。
在GTC China展厅,智加科技展示了与一汽联合开发的自动驾驶卡车,它利用多模态传感器融合和环绕感知,以实现安全的无人驾驶商业运营。
另一辆自动驾驶卡车也在会上展出。总部设在中国和美国的TuSimple正在开发一种基于摄像头的感知系统,该系统可以让卡车在任何时候都能看到1000米以外的地方。更高的分辨率,加上在NVIDIA DRIVE上运行的深度学习感知,让驾驶更安全。
AutoX是一家自动驾驶配送初创公司,于8月份在加利福尼亚州圣何塞市开展了自动驾驶试点,同时选用了DRIVE AGX Pegasus来实现L4级别最后一英里配送。该公司正在使用相机视觉和其他传感器输入,结合NVIDIA DRIVE AGX平台的冗余和多样性,以实现安全的无人驾驶食品交付。
电动车新势力企业选择DRIVE AGX Xavier过去5年中,中国在电动汽车技术方面的投资超过150亿美元,旨在到2020年生产200万辆电动汽车,到2025年增至700万辆,已经成为新一代电动汽车初创企业的大本营。这些初创公司致力于全新动力总成技术以及自动驾驶,且正在使用NVIDIA DRIVE AGX Xavier来实现这一目标。
总部位于中国广州的初创公司小鹏汽车及其主要的一级供应商德赛西威将使用每秒可处理30万亿次操作、功率仅为30瓦的DRIVE AGX Xavier,致力于至2020年打造面向量产车型的L3级自动驾驶系统。L3级自动驾驶使汽车能够自行转向和制动,但在某些条件下仍需要手动控制。
XPeng G3是一款由NVIDIA DRIVE驱动的智能电动汽车,配备了X-Pilot高级驾驶员辅助系统、自动停车和人工智能语音助手。
DRIVE AGX Xavier还将为来自北京的奇点汽车即将推出的车辆提供技术支持,奇点汽车是一家为L3级自动驾驶开发软件定义、可定制电动车的初创公司,旨在于2020年实现量产。此外,SF Motors计划于明年推出其首款电动分频器SF5,并表示将采用DRIVE AGX Xavier开发下一代自主计算平台。
这些开发中的车辆和服务有可能极大地改变人员和货物在全球的运输方式,且在NVIDIA DRIVE AGX的助力下,这一进展将带来更安全、更高效的未来。