在近日举办的在GTC China 2017上,华为展示GPU加速云服务和全新一代智能硬件平台Atlas,为人工智能和深度学习的广泛应用铺平道路,成为本次大会的亮点。
三大亮点--Atlas代言华为云新一代智能硬件平台
多种异构资源:华为高性能异构计算服务器、通用服务器和存储服务器,提供GPU和存储等多种异构资源池。
硬件可编排:通过智能调度平台提供统一的编排调度,实现异构资源的按需获取和使用,资源利用率提升50%以上。
秒级部署:华为云平台秒级部署能力,快速提供逻辑服务器,大幅减少业务部署周期。
三大亮点使得Atlas云平台提供"资源池化编排"能力:通过异构计算服务器组建基于CUDA接口的弹性资源池,GPU资源不绑定VM,用户可以根据需求动态申请、释放和修改GPU资源,同时支持多种拓扑配置,可以一键切换GPU资源拓扑。GPU资源池化的优势是按GPU资源使用时长收费,从而提供高性价比的GPU加速云服务。
华为云在人工智能和深度学习领域,新推出基于NVIDIA? Tesla? P100 GPU的P1实例和基于 Tesla P4 GPU的PI1实例。
P1实例主打计算加速,尤其擅长深度学习的训练场景,单节点包含8块业界领先的Tesla P100 GPU。
PI1实例更适用于计算推理场景,支持最高达22TFLOPS INT8运算能力。
P1和PI1可实现一键部署Caffe、TensorFlow和MXNet等主流深度学习框架,并可通过华为大数据和AI引擎提供的图像识别和大数据分析等服务快速构建企业级应用。
图1 基于Atlas的华为云GPU加速P1和PI1实例
三大应用场景--面向多个行业提供全套解决方案
图2 华为GPU加速服务全行业解决方案
图形图像
华为云GPU加速云服务G1实例,搭载业界领先高性能虚拟工作站显卡NVIDIA Tesla M60和NVIDIA GRID,提供卓越的性能和可靠性,在虚拟图形桌面、轻量级图形处理等场景下,搭配Workspace桌面云,让用户体验到更好的前端效果。
华为云GPU加速云服务G2实例,搭载NVIDIA M60和直通模式,搭配更大规格的内存和vCPU,主打专业虚拟图形工作站、图形图像渲染和视频编解码等场景。
人工智能AI
华为云GPU加速云服务P1和PI1实例,分别采用业界领先数据中心级GPU NVIDIA Tesla P100和Tesla P4,分别满足AI领域在训练和推理方面的需求,资源池化和自动编排让用户可以更快速、更高效、更合理的使用异构计算资源,极大提升人工智能以及深度学习的效率。
华为云为全球人工智能领域提供强大的云上计算平台和计算能力,满足语音识别、自动驾驶、智能推荐和智能医疗等领域对异构计算的需求。
高性能计算HPC
对计算性能要求高的行业 ,华为云推出了GPU+裸机的解决方案,提升仿真精度和双精度浮点运算,深度挖掘硬件计算能力,打造强大、高速、安全的高性能计算平台,在气象预测、石油勘探和分子动力模拟等领域有广泛应用。
华为将与NVIDIA通过开放生态合作,提供更高性能的云上GPU加速解决方案。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
大模型时代,玛丽·米克尔(Mary Meeker)的名字可能大家不一定熟悉,但是在互联网时代,这位被可被誉为“互联网女皇”的。她是美国风险投资家和前华尔街证券分析师,专注于互联网及新兴技术领域。玛丽·米克尔(Mary Meeker)发了一份340页的《人工智能趋势报告》,粗粗看了一下,并没有非常轰动的观点,但是数据比较全面
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。