HPC存储阵列制造商Panasas公司一直在探索横向扩展的并行文件系统存储阵列,涉及向单独的横向扩展控制器节点与横向扩展的存储节点之间进行连接。
这家总部位于宾夕法尼亚州的企业距离硅谷各知名风投企业可谓距离遥远,但这仍不妨碍Panasas公司在硅谷地区获得一定知名度。而更难能可贵的是,这家已经拥有17年历史的高性能计算(简称HPC)/超级计算存储厂商仍处于私营状态。
该公司上一次融资进行于2013年,其中1500万美元来自私募融资,2520万美元源自风投的F轮融资——且迄今为止,其总融资额已经达到6520万美元。该公司指出,目前其已经在全球50多个国家拥有500多家客户。
其中规模最大的客户当数英国的Rutherford Appleton实验室,其JASMIN系统采用容量高达20 PB的Panasas存储方案,约由1500块存储刀片共同实现。
自2010年4月就任以来,该公司一直由CEO兼总裁Faye Pairman引领。
Panasas公司CEO兼总裁Faye Pairman
这是一家相当保守的企业,对一切事物皆抱有小心谨慎的态度——特别在是否该进入日益增长的商业高性能计算市场这个问题上更是如此。该公司早在多年之前就已经开始布局,近期更是拓展新的架构以强化其并行文件系统阵列产品。
该公司目前已经能够对计算与存储资源进行独立扩展,并开始分别对这两类组件进行开发。
根据我们掌握的情况,目前商业高性能计算领域已经出现一股明确的趋势,即小文件开始大规模增长。由于Panasas公司专长于将小文件与NAS元数据存储在闪存中,这显然会对存储节点(更多访问)与控制器节点造成影响,因为相对于文件数据所占用的空间而言,会有更多的元数据需要处理。
为了解决这些问题,其控制器节点与存储节点很可能需要得到进一步发展。
ASD-100控制器节点采用英特尔至强E5-1630 v4 3.7 GHz四核心Broadwell CPU。这意味着其下一代版本可能会升级为Skylake至强处理器——届时小文件与元数据的处理能力将得到大幅提升。
高级软件架构师Curtis Anderson告诉我们:“我们不再受到计算能力的限制——我们如今拥有大量控制器节点。”他还提到利用具备更高内存容量与/或CPU资源的“大节点”以“处理更多小文件”的可能性。
就目前而言,存储刀片拥有两大性能驱动因素,其一为SSD、其二为Atom处理器。
Panasas公司的高密度机架存储模块
Anderson解释称,Panasas公司正在改变每款存储刀片中的驱动器数量,并计划在下一代存储方案中提升容量水平。该公司希望能够利用更多行业标准组件构建相关产品。
届时其很可能推出多种不同刀片产品类型,具体包括全闪存性能刀片、性能混合刀片以及高容量混合刀片。这很可能将使得Panasas公司拥有更多空间以适应不断变化的高性能计算工作负载。
Faye Pairman解释称,Panasas公司的投资者们也同样非常保守; 此外这是一家小型公司,仅拥有100名员工,因此影响范围有限:“我们主要面向美国市场,但也已经开始了对海外市场的探索。”
Panasas公司正在持续发展,Pairman则以“按部就班”形容其推进状态。该公司正在摆脱对少数小型政府客户的依赖,转而发展自身架构与产品功能,旨在抢先于时代与整体市场之前。
Panasas公司的直接竞争对手包括DDN与Isilon,而Qumulo也很可能即将与其发生摩擦。DDN掌握的产品数量更多,其中WOS对象存储与IME峰值缓冲产品,外加并行文件系统ExaScaler与GridScaler系统的覆盖范围也更广。但Panasas方面声称其文件系统拥有更低的管理难度,而速度表现也要更胜一筹。
Isilon公司是目前向外扩展NAS市场上的领导者,这主要得益于戴尔公司的销售与市场营销体系为其提供的支持。另一方面,Qumulo也在快速发展,且正在积极吸纳对戴尔内部工作环境感到不满的Isilon员工。
Qumulo公司于2012年由前Isilon骨干所建立,并于两年半之后发布了自己的首款产品。该公司目前拥有200名员工,数量相当于Panasas的两倍,已经筹得1.3亿美元风险投资——同样相当于Panasas的两倍。
Panasas公司一直将自身定位为一家传统的商业高性能计算厂商,而Qumulo却将自身描述为一家全球性向外扩展文件系统存储企业——可容纳十亿文件规模并提供最佳速度表现。而尽管Panasas的商业高性能计算(并行文件系统)市场空间较Qumulo的向外扩展文件系统空间更小,但我们猜测前者的文件系统性能表现却要优于后者。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。