GPU开始在超算领域崭露头角。在最新公布的2017中国高性能计算TOP 100排行榜中,已经有28套采用NVIDIA Tesla GPU,其中22套为Tesla P100。中国工程院院士廖湘科表示,今天人们借鉴GPU在超算领域的经验,已经将其引入人工智能领域。GPU的出现对人工智能新崛起起到了积极推动作用。NVIDIA副总裁暨中国区企业事业总经理沈威也表示AI现在已经变成高性能运算的一个杀手级应用。有越来越多的高性能运算中心有专属的AI超算。
从互联网图像、视频分类、语言识别、自然语言处理等服务到医疗领域癌细胞探测、药物发现再到安防领域人脸识别、视频监控、网络安全再到智慧交通领域行人识别、车道跟踪、交通信号识别。基于深度学习和人工智能的快速发展,人们对与计算能力的需求呈指数型增长,对于计算加速也呈现爆炸式增长。同时深度学习已经渗入到各个行业,沈威举例中国移动是中国最大的呼叫中心,有超过1.5万个话务员,他们也使用了深度学习和GPU技术大量了减轻了人工的负担。
在金融领域,平安科技采用GPU和深度学习的方法来协助自身业务。比如车险业务,你只要拿出手机拍个照传输过去,它马上就可以基于照片上拍出来的损坏状况来做定损,也是深度学习在传统行业应用的体现。 这些应用背后是NVIDIA的技术创新和应用落地。
NVIDIA推出世界领先的HPC 和 AI 数据中心加速平台TESLA 平台,这个平台包括端到端的产品系列,基于深度学习训练和推理Training - Tesla P100和Inference - Tesla P4 & P40,Tesla P100 with NVLink可以为数据 中心HPC and DL应用 应用可扩充到多GPUs,数据中心HPC 应用 混合的 CPU和 GPU作业,Tesla P100 with PCI-E,集成的深度学习超级计算机DGX-1。
在HPC 2017现场展示上,NVIDIA展示了最先进的产品和应用。
现场展示了DGX Station超级计算机,可以说是业界唯一一款专门针对个人设计的超级计算机。它采用了工作站式的设计、采用了很多新技术。在架构上采用了最新TESLA V100 GPU + NVLink,配置了4个GPU,GPU之间用最新NVLink高速带宽连接起来,性能可高达480 TeraFlops;虽然售价为69000美元,听起来比较贵但是其服务器性能大约相当于124台的CPU服务器性能,从性价比来看,还是非常有优势。设计亮点采用了水冷设计实现静音(35分贝低噪音),这是目前业界唯一在工作站采用液冷设计的产品,非常静音,适合办公室环境。过去风冷的设计可能噪声会比较大,现在采用了水冷设计,整个机器的噪音只有35分贝,非常低,在办公室里可以很安静的工作,不会打扰我们的正常思维,这是我们设计最大的一个亮点。
而且它是专门针对深度学习这款产品不光有硬件,而且软件都预装好了,开机只要经过简单设置,就可以用Caffe、TensorFlow等做深度学习的训练,图像识别也好,语音识别也好,而无需花费大量的时间自己去配置软件、装驱动、SDK等等。
现场还进行可视化实时仿真的演示。Ansys公司和NVIDIA经历4年时间,利用CUDA制作了一款叫做Discovery Live的软件。目前,这个软件仍为技术预览版,预计明年的2月份会正式发布。
通过NVIDIA强大的加速能力,这款软件能够实现可视化实时仿真,即借助NVIDIA GPU的并行处理能力,实现传统计算仿真和可视化渲染的完美结合。
简单说就是以前只能先进行仿真模拟,在进行可视化渲染,仿真模拟过程错了还需要从头修改,现在通过强大的计算处理能力能够实现仿真模拟和可视化渲染的完美结合。以前若在验证的过程中发现设计存在的缺陷再回头修改设计,是一个重复的过程;现在,计算和可视化能够在单台工作站实现,大大提升了工作效率。
如上图所示:这个测试的是车。刚才介绍的物理场,比如测试车的风阻系数,可以加入这个模拟状态,位置的改变会调整车的风阻模拟参数:比如加入导风设计,车的风阻系数就会发生改变。
DeepStream,能够实现30路高清视频解码、实时分析和元数据提取,可以时时处理30路视频的解码,解码完了以后通过深度学习的算法提取里面感兴趣的物体,在这里可以看到这些人和这些车,提取完了以后可以做一些声音的处理。大家可以看到这个应用可以把30路视频里所有的人和车都提取出来。
最后在至顶网记者看来,NVIDIA 产品大受欢迎核心就是其具有加速的能力、因为不管是高性能计算、还是人工智能以及大数据应用,更快的速度成为其必备的要求之一,具体来讲,采用GPU对于训练和推理来说其具有大的优势,一个是训练,几十亿,上万亿的操作,GPU 可以训练大的模型,加速应用走向市场。二个是数据中心推理, 每天数十亿的图像,语音,视频的查询,GPU 推理加速相应时间,使数据中心推理吞吐量最大化。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。