通常娱乐和媒体市场不被看作是高性能计算市场的一部分,具有相关大规模的并行文件访问和数据集管理。在HPC领域,现在可以经常看到像Lustre和GPFS(重新命名为Spectrum Scale)这样的文件访问软件。
HPC是一个学术和超级计算专业领域,但是已经扩展到商用领域,因为石油和天然气及生命科学领域的业务开始转向HPC来处理不断增长的数据量。我们看到有大量工作人员并行地运行新数据,老数据归档到后端存储库,设置工作流结构来管理这些数据和流程。
娱乐和媒体领域也在朝着相同的方向发展。电影分辨率日渐提高以实现具有特效的现实,数字艺术家们为虚拟演员创造了生动且多层次的背景。这正是昆腾(Quantum)横向扩展的StorNext文件访问管理和虚拟化产品的核心。
StorNext通过数据捕获提供主文件数据存储和访问,旧文件保存在近线(对象存储)磁盘或者磁带或者公有云上,根据需要由工作流程在这些存储层之间迁移文件,通过用不那么昂贵的存储层来保存那些不需要立即访问的数据,降低数据和存储库的成本。
昆腾表示,StorNext已经扩展运用到视频监控、车联网(例如自动驾驶汽车)、生命科学以及其他HPC可以发挥作用的垂直市场。
StorNext并不参与传统HPC市场的竞争,也就是中小型集群的HPC。但是据昆腾营销副总裁Molly Rector称,StorNext在商用HPC领域的确与Spectrum Scale和Lustre相竞争。
当数据增长超过1PB的时候,NAS系统可能就遇到问题了。这时候横向扩展的StorNext、Lustre和Spectrum Scale包含NAS会在数据密集型环境中蔓延。
Rector在去年9月加入昆腾,当时昆腾一直在发展StorNext业务,因为昆腾的DXi数据保护产品增长乏力,磁带产品持续疲软。
为了让StorNext继续增长,就必须让StorNext从娱乐和媒体这个核心市场扩展到更广泛的企业用途中。所以昆腾将其定位为一款客户用来拯救NAS蔓延的产品,而不是作为Spectrum Scale和Lustre的替代选择。昆腾已经聘请了HPC方面的专家,例如来自Adaptive的销售专家Jason Coari。
StorNext所在的领域就像是一个复杂的制造流程:通过仔细定义和管理的数据制造,处理数字组件的分层工作流,两者结合完成一款数字产品、一部电影或者视频,一个油田模型,或者基因组分析。在这周制造流程背后的基础设施设计和操作十分关键。昆腾希望StorNext在娱乐和媒体领域的经验能够让它在以数据为推动的数据产品制造市场取得进展。
战争已经打响,横向扩展的并行文件访问提供商目标是占领传统文件系统止步不前甚至落后下来的领域。客户将根据性能、采购成本和运营成本,以及工作流灵活性和成熟度来购买系统。
像DDN、Dell(全闪存的Ision)这样的提供商,以及XtremIO、Avere和Qumulo等,将矛头直接对准了Spectrum Scale和Lustre提供商。昆腾现在也加入其中,作为一家横向扩展、数字化数据产品制造工作流提供商。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。