德州大学奥斯汀分校的德州先进计算中心(TACC)即将推出Horizon AI和仿真超级计算机,它将成为世界上最大的专门用于开放科学研究的学术超级计算机。该系统将成为美国国家科学基金会(NSF)即将推出的领导级计算设施(LCCF)的旗舰产品。
Horizon是一台400 petaFLOP/s的超级计算机,与TACC现有的Frontera系统相比,将提供10倍的仿真性能提升和100倍的AI能力增长。曾经排名TOP500全球最快计算机第5位的Frontera系统使用56 PB的DDN EXAScaler Lustre存储。
VAST Data正在为Horizon提供其AI OS作为数据层。TACC表示,Horizon将拥有400PB的本地全闪存存储,"提供超过10TB/s的读写带宽以及多租户和服务质量功能"。
TACC执行董事Dan Stanzione表示:"VAST在两年多的时间里帮助我们简化了在Stampede3和Vista上管理和访问数据的方式,我们很兴奋能将这种方法扩展到Horizon,为研究人员创造更快的成果产出时间——减少数据移动时间,增加运行模型、训练AI和发布发现的时间。"
VAST Data此前在2023年7月赢得了为TACC的Stampede3超级计算机提供13 PB存储的合同,同时也为TACC的Vista系统提供存储。该公司表示,其AI OS"在Stampede3、Vista和Horizon之间提供一致的数据体验,使用户和管理员能够在容量和性能提升时延续熟悉的工作流程——帮助新社区快速上手"。
Horizon将由Ranch支持,这是一个使用Spectra Logic TFinity Plus磁带库的EB级归档系统。Spectra正在与Dell和Versity合作交付Ranch归档系统,这是Dell交付过的容量最高的归档系统之一。该系统将包含两个15框架的磁带库,配备20个LTO-9驱动器,可支持1 EB的存储容量。系统将升级以增加16个LTO-10驱动器。
Versity的ScoutAM软件归档管理系统将在13台Dell PowerEdge R760服务器上运行,自动化数据在5个Dell ME5存储阵列(构成4PB闪存层)、16 PB扩展缓存Dell ECS对象存储以及Spectra TFinity库之间的移动。
Spectra首席执行官Nathan Thompson表示:"随着Horizon设定提供10倍仿真性能改进和100倍AI能力飞跃的目标,TACC需要一个经过验证的归档解决方案来匹配其愿景和学术需求。"他说TFinity Plus系统具有"在关键任务环境中无与伦比的密度、弹性和成功记录"。
Q&A
Q1:Horizon超级计算机的性能比现有系统提升了多少?
A:Horizon是一台400 petaFLOP/s的超级计算机,与TACC现有的Frontera系统相比,将提供10倍的仿真性能提升和100倍的AI能力增长。它将成为世界上最大的专门用于开放科学研究的学术超级计算机。
Q2:Horizon的存储系统由哪些公司提供?
A:Horizon的存储系统由四家公司共同提供:VAST Data提供400PB的本地全闪存存储作为AI OS数据层;Dell提供缓存归档前端和服务器;Versity提供ScoutAM归档管理软件;Spectra Logic提供TFinity Plus磁带库作为离线存储。
Q3:Ranch归档系统的存储容量有多大?
A:Ranch是一个EB级归档系统,使用Spectra Logic TFinity Plus磁带库。系统包含两个15框架的磁带库,配备20个LTO-9驱动器,可支持1 EB的存储容量,并将升级增加16个LTO-10驱动器以进一步扩展容量。
好文章,需要你的鼓励
网络流量保护专家Cloudflare因其Access零信任平台发生故障向客户道歉,该故障导致包括OpenAI的ChatGPT、DownDetector和社交媒体平台X在内的多个面向公众的服务中断。故障始于英国时间上午11点20分左右,最初被描述为"内部服务降级"。Cloudflare后续确认故障根本原因是自动生成的配置文件超出预期大小并触发软件系统崩溃,强调这并非攻击所致。
香港科技大学团队发表重要研究,开发GIR-Bench测试基准评估统一多模态AI模型的推理与生成能力。研究发现即使最先进的AI模型在理解与生成之间也存在显著差距,无法有效将推理过程转化为准确的视觉生成,为AI行业发展提供重要警示。
戴尔PowerScale文件系统存储现已作为Azure托管服务提供,PowerStore块存储成为微软Azure Local产品的选项。PowerScale支持高达8.4 PB单一命名空间存储,性能比竞争对手高出4倍。Azure Local与戴尔私有云和PowerStore的集成预计于2026年春季进入早期访问阶段。
Meta超级智能实验室联合麻省理工学院开发了SPG三明治策略梯度方法,专门解决扩散语言模型强化学习训练中的技术难题。该方法通过上下界策略为AI模型提供精确的奖惩反馈机制,在数学和逻辑推理任务上实现了显著性能提升,为AI写作助手的智能化发展提供了新的技术路径。