HPC供应商DDN加入小型的、但不断增长逐渐进入企业AI主流市场的公司,DDN旗下的存储产品可与Nvidia的DGX-1 GPU服务器结合在一起。
DDN最近出台了一系列举措以扩展旗下企业存储公信力,上个月收购了Tintri(https://www.theregister.co.uk/2018/09/05/ddn_buys_tintri_biz_remains_for_60mn/)后有了出售企业存储阵列的能力,现在又凭借旗下A3I品牌的可扩展参考架构产品进入人工智能(AI)系统领域。
企业AI系统市场最初由Pure建立,Pure将AIRI(https://www.theregister.co.uk/2018/03/27/pure_nvidia_ai_airi/)的FlashBlade阵列与DGC-1双响炮结合在一起。后来NetApp携其A700全闪存阵列/ FGX-1组合加入该市场,后来又推出更快的A800/ DGX-1装置(https://www.theregister.co.uk/2018/08/03/netapp_a800_pure_airi_flashblade/)。戴尔EMC则推出人工智能完备解决方案(Ready Solution for AI):深度学习(https://www.theregister.co.uk/2018/08/07/dell_emc_ai_deep_learning/ ),思科也推出了C480 AI /机器学习服务器(https://www.theregister.co.uk/2018/09/10/cisco_ai_server_nvlinked_tesla_gpu/)。
所有这些系统都涉及到全闪存,DDN则拥有AI200和AI400全闪存系统以及混合闪存/磁盘AI7990。二者都运行DDN的Exascaler软件,Exascaler是个基于Lustre的并行文件系统。
AI200是个容量高达360TB的24倍双端口NVMe闪存驱动器,置于2U机箱内,以4 x EDR InfiniBand(EDR IB)或100Gbit / s以太网(100 GbitE)连接到DGX-1。AI200可提供高达20GB/秒的文件系统顺序读取吞吐量和超过100万IOPS。
AI400使用相同的机箱,可提供高达40GB/秒的顺序读取吞吐量和高达300万IOPS。AI400具有8个EDR InfiniBand端口或100GbitE端口,闪存容量与AI200相同。
而较大的AI7990则置于4U机箱内,回归20Gb /秒的顺序读取性能,可提供高达700,000的IOPS。AI7990支持90 x 3.5英寸的插槽,可用于SSD和磁盘驱动器。最多可以有4个扩展机座,每机座有90个架,可提供高达5.6PB的容量。
DDN 的A3I解决方案简介可从网上下载(https://www.ddn.com/?wpdmdl=42534&ind=1538608827207),简介里提供了使用A3I软件的示例,例如Resnet-50和Resnet-152,Caffe GoogleNet,Inception V3 。
A3I解决方案指南(http://www.ddn.com/?wpdmdl=42573&ind=1538599065785)提供了Tensorflow,Horovod,TensorRT,Torch,PyTorch提供具有9 x DGX-1服务器和系统性能的AI200及其他AI框架的配置示例。
在Resnet-152和Resnet-50测试中,AI200的测试速度比竞争对手Pure、NetApp和Dell EMC的系统更快。思科未提供旗下AI系统性能的任何公开信息。
AI200和AI7990数据表可从此处获取:https://www.ddn.com/products/a3i-accelerated-any-scale-ai/。
好文章,需要你的鼓励
TechCrunch Disrupt 2025 AI舞台将汇聚塑造科技未来的领军人物,顶尖风投将揭示在快速变化的AI领域获得融资的关键。来自Apptronik、ElevenLabs、Hugging Face、Runway等创新企业的领导者将分享前沿洞见,探讨AI如何重塑创意过程、改变物理世界、变革国防安全和重新定义人际关系。10月27-29日,五大主题舞台将在旧金山呈现科技创新的未来图景。
西班牙研究团队提出了一种创新的AI自我纠错方法SSC,让人工智能学会识别和修正规则中的漏洞。当AI发现自己在钻空子获得高分时,它会反思规则的合理性并主动改进。实验显示这种方法将AI的"钻空子"行为从50-70%降低到3%以下,同时提升了回答质量。这项技术有望让AI从被动执行指令转变为能够质疑和改进指令的智能协作伙伴。
英超联赛与微软达成五年战略合作伙伴关系,推出AI驱动的Premier League Companion服务,为全球球迷提供个性化体验。该服务利用Azure OpenAI技术,整合30多个赛季的统计数据、30万篇文章和9000个视频,帮助球迷发现和了解更多内容。未来还将为Fantasy Premier League引入个人助理经理功能,并通过Azure AI优化比赛直播体验和赛后分析。
这篇文章详细解析了Long、Shelhamer和Darrell在2015年CVPR会议上发表的开创性研究"全卷积网络用于语义分割"。文章以通俗易懂的方式,将这项复杂的技术比作艺术家的绘画过程,解释了如何让计算机不仅识别图像中有什么物体,还能精确标出每个物体的位置和边界。研究团队通过将传统分类网络改造为全卷积形式,并巧妙运用上采样和跳跃连接技术,实现了高效准确的像素级图像理解。这一突破为自动驾驶、医学影像和增强现实等领域带来了革命性变化,奠定了现代计算机视觉的重要基础。