从高性能计算到人工智能—GPU的加速能力得到广泛认同原创

GPU开始在超算领域崭露头角。在最新公布的2017中国高性能计算TOP 100排行榜中，已经有28套采用NVIDIA Tesla GPU，其中22套为Tesla P100。

GPU开始在超算领域崭露头角。在最新公布的2017中国高性能计算TOP 100排行榜中，已经有28套采用NVIDIA Tesla GPU，其中22套为Tesla P100。中国工程院院士廖湘科表示，今天人们借鉴GPU在超算领域的经验，已经将其引入人工智能领域。GPU的出现对人工智能新崛起起到了积极推动作用。NVIDIA副总裁暨中国区企业事业总经理沈威也表示AI现在已经变成高性能运算的一个杀手级应用。有越来越多的高性能运算中心有专属的AI超算。

NVIDIA副总裁暨中国区企业事业总经理沈威

从互联网图像、视频分类、语言识别、自然语言处理等服务到医疗领域癌细胞探测、药物发现再到安防领域人脸识别、视频监控、网络安全再到智慧交通领域行人识别、车道跟踪、交通信号识别。基于深度学习和人工智能的快速发展，人们对与计算能力的需求呈指数型增长，对于计算加速也呈现爆炸式增长。同时深度学习已经渗入到各个行业，沈威举例中国移动是中国最大的呼叫中心，有超过1.5万个话务员，他们也使用了深度学习和GPU技术大量了减轻了人工的负担。

在金融领域，平安科技采用GPU和深度学习的方法来协助自身业务。比如车险业务，你只要拿出手机拍个照传输过去，它马上就可以基于照片上拍出来的损坏状况来做定损，也是深度学习在传统行业应用的体现。这些应用背后是NVIDIA的技术创新和应用落地。

NVIDIA推出世界领先的HPC 和 AI 数据中心加速平台TESLA 平台，这个平台包括端到端的产品系列，基于深度学习训练和推理Training - Tesla P100和Inference - Tesla P4 & P40，Tesla P100 with NVLink可以为数据中心HPC and DL应用应用可扩充到多GPUs，数据中心HPC 应用混合的 CPU和 GPU作业，Tesla P100 with PCI-E，集成的深度学习超级计算机DGX-1。

在HPC 2017现场展示上，NVIDIA展示了最先进的产品和应用。

现场展示了DGX Station超级计算机，可以说是业界唯一一款专门针对个人设计的超级计算机。它采用了工作站式的设计、采用了很多新技术。在架构上采用了最新TESLA V100 GPU + NVLink，配置了4个GPU，GPU之间用最新NVLink高速带宽连接起来，性能可高达480 TeraFlops；虽然售价为69000美元，听起来比较贵但是其服务器性能大约相当于124台的CPU服务器性能，从性价比来看，还是非常有优势。设计亮点采用了水冷设计实现静音（35分贝低噪音）,这是目前业界唯一在工作站采用液冷设计的产品，非常静音，适合办公室环境。过去风冷的设计可能噪声会比较大，现在采用了水冷设计，整个机器的噪音只有35分贝，非常低，在办公室里可以很安静的工作，不会打扰我们的正常思维，这是我们设计最大的一个亮点。

而且它是专门针对深度学习这款产品不光有硬件，而且软件都预装好了，开机只要经过简单设置，就可以用Caffe、TensorFlow等做深度学习的训练，图像识别也好，语音识别也好，而无需花费大量的时间自己去配置软件、装驱动、SDK等等。

现场还进行可视化实时仿真的演示。Ansys公司和NVIDIA经历4年时间，利用CUDA制作了一款叫做Discovery Live的软件。目前，这个软件仍为技术预览版，预计明年的2月份会正式发布。

通过NVIDIA强大的加速能力，这款软件能够实现可视化实时仿真，即借助NVIDIA GPU的并行处理能力，实现传统计算仿真和可视化渲染的完美结合。

简单说就是以前只能先进行仿真模拟，在进行可视化渲染，仿真模拟过程错了还需要从头修改，现在通过强大的计算处理能力能够实现仿真模拟和可视化渲染的完美结合。以前若在验证的过程中发现设计存在的缺陷再回头修改设计，是一个重复的过程；现在，计算和可视化能够在单台工作站实现，大大提升了工作效率。

如上图所示：这个测试的是车。刚才介绍的物理场，比如测试车的风阻系数，可以加入这个模拟状态，位置的改变会调整车的风阻模拟参数：比如加入导风设计，车的风阻系数就会发生改变。

DeepStream，能够实现30路高清视频解码、实时分析和元数据提取，可以时时处理30路视频的解码，解码完了以后通过深度学习的算法提取里面感兴趣的物体，在这里可以看到这些人和这些车，提取完了以后可以做一些声音的处理。大家可以看到这个应用可以把30路视频里所有的人和车都提取出来。

最后在至顶网记者看来，NVIDIA 产品大受欢迎核心就是其具有加速的能力、因为不管是高性能计算、还是人工智能以及大数据应用，更快的速度成为其必备的要求之一，具体来讲，采用GPU对于训练和推理来说其具有大的优势，一个是训练，几十亿，上万亿的操作，GPU 可以训练大的模型，加速应用走向市场。二个是数据中心推理，每天数十亿的图像，语音，视频的查询，GPU 推理加速相应时间，使数据中心推理吞吐量最大化。

来源：至顶网存储频道

0赞

好文章，需要你的鼓励

从高性能计算到人工智能—GPU的加速能力得到广泛认同 原创

NVIDIA副总裁暨中国区企业事业总经理沈威

来源：至顶网存储频道

2017

10/30

22:37

分享

点赞

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

多站点IT基础设施升级指南：告别VMware的替代方案

戴尔集成Elasticsearch与英伟达Blackwell GPU升级AI数据平台

Confluent Cloud为智能体提供实时数据流处理能力

数字化转型失败的6个警示信号

OpenAI CEO阿尔特曼承认当前处于AI泡沫期

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

多家机器人企业亮相WRC“秀肌肉” NVIDIA Jetson Thor成“标配”

“GPU闲置过半，器件逼近物理极限”？是德科技如何应对AI基础设施之困

Graid基于Nvidia GPU的RAID卡技术突破及产品路线图

VAST Data凭借Doudna超算项目成功进军高性能计算领域

VDURA瞄准VAST、WEKA、DDN，以AI-HPC存储重启挑战市场

PCIe 7.0规范正式发布，带宽达512GBps，PCIe 8.0已在筹备中

GTC 巴黎｜黄仁勋交出一份新工业革命的完整“蓝图”

桑迪亚启用类脑无存储超算

法国政府正式出价4.1亿欧元收购Atos精简后的高性能计算资产

报告：Nvidia 加快开发针对中国市场的新型低功耗 Blackwell GPU

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

从高性能计算到人工智能—GPU的加速能力得到广泛认同原创