在传统的高性能计算(HPC)领域,平行文件系统的核心任务是为超级计算机的多个处理器高速提供数据。然而,当AI重新定义了需求环境,非结构化数据流变得与文件一样重要时,供应商应该如何应对?
Quobyte公司提供同名的平行文件系统软件,声称其软件是"为AI而设计"。这是因为该软件由曾在谷歌工作的程序员创立的Quobyte公司开发,他们设计的软件能够简单轻松地扩展,并能应对各种故障并保持运行。
首席执行官Bjorn Kolbeck和首席技术官Felix Hupfeld表示,与快速、可扩展且复杂的HPC软件相比,传统企业存储显得简单、可靠但速度较慢。AI文件/对象存储需要结合两者的优势,既要像操作智能手机一样简单,又要具备防弹级可靠性、高速性能、艾字节级扩展能力和超大规模效率。
Kolbeck介绍,Quobyte软件可以在本地部署,既可以在核心数据中心也可以在边缘站点运行,支持x86、Arm或英伟达Grace CPU,可部署在托管站点、公有云或这些位置的混合组合中,并支持GPU服务器上的CPU附加存储,即零层存储。
该软件与硬件无关,将所有硬件视为潜在的不可靠组件。Quobyte声称提供100%的全天候可用性,具备数据中心规模的软件容错能力,无需维护窗口。它专为多租户设计,在租户环境之间提供强隔离和基于策略的数据管理。
Quobyte支持从4台到数万台存储服务器的动态、按需和无缝扩展。数据性能可线性扩展至TB每秒级别,Quobyte声称在MLPerf 3D-Unet测试中拥有最快、最高效的文件系统,支持每台客户端机器最多的GPU数量,并具有每性能单位最低的成本和能耗。
实际上,Quobyte声称比最接近的竞争对手快33%,比其他竞争对手好几个数量级。
该软件采用单层架构,在标准Linux上运行,无需内核模块,不需要数据平面开发工具包(DPDK),使用标准的商用计算、存储和网络硬件,没有特殊要求。管理负担很轻,Quobyte表示,小团队可以扩展到艾字节容量,无需仔细的长期规划。该文件系统几乎像数据库一样,具有端到端可观测性,提供所有组件的指标,支持Prometheus时间序列指标和Grafana数据可视化。
Quobyte成立于2013年。据了解,2014年进行了A轮融资(筹集了7位数欧元),由High-Tech Gründerfonds(HTGF)和Target Partners出资。其他投资者包括Alstin Capital、三星催化基金和Yttrium。2016年进行了B轮融资,筹集了未披露的金额,此后再无融资。Quobyte此后未再接受风险投资,正在有机增长。
客户包括空客、Booking.com、雅虎日本、西门子和Zoox,其中Zoox拥有一个70 PB的系统,存储可供超过4万个客户端使用的自动驾驶数据。
Quobyte为PB到EB规模的工作负载提供高性能文件/对象存储系统软件,没有麻烦,没有大惊小怪,几乎没有营销预算。其竞争对手包括英伟达合作伙伴DDN、Pure Storage、WEKA、VAST Data、IBM Storage Scale,以及戴尔、慧与和NetApp。这些厂商在存储市场的地位举足轻重,拥有庞大的工程和市场推广组织,而Quobyte主要依靠其软件性能、规模、简洁性和可靠性,以及客户的口碑来发展壮大。
我们希望本季度晚些时候能看到Quobyte推出重要的AI相关软件功能新闻。值得关注。
Q&A
Q1:Quobyte文件系统软件有什么特殊优势?
A:Quobyte提供100%全天候可用性,具备数据中心规模的软件容错能力,无需维护窗口。支持从4台到数万台存储服务器的动态无缝扩展,性能可线性扩展至TB每秒级别,在MLPerf 3D-Unet测试中比最接近的竞争对手快33%。
Q2:Quobyte软件在硬件方面有什么要求?
A:Quobyte软件与硬件无关,采用单层架构,在标准Linux上运行,无需内核模块,不需要数据平面开发工具包,使用标准的商用计算、存储和网络硬件。支持x86、Arm或英伟达Grace CPU,可部署在本地、云端或混合环境中。
Q3:哪些知名公司在使用Quobyte的解决方案?
A:Quobyte的客户包括空客、Booking.com、雅虎日本、西门子和Zoox等知名企业。其中Zoox拥有一个70 PB的系统,专门存储可供超过4万个客户端使用的自动驾驶数据,展现了该系统在大规模数据处理方面的能力。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
腾讯等机构提出ViQ框架,通过两阶段渐进量化训练,让离散视觉编码在多模态理解和图像重建上同时追平连续特征编码器,训练速度最高提升70%。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港科技大学与华为联合提出LISA训练方法,通过让副网络对齐"似然分数",将ControlNet等图像生成模型的训练收敛速度提升逾2.78倍,同时改善图像质量与条件控制精度。