软件定义存储提供商 DataCore 正在从法国供应商 Kalray 手中收购 Arcastream 并行文件系统。
创业公司 Kalray 成立于 2008 年,是从法国原子能委员会 (CEA) 分拆出来的无晶圆厂半导体企业。该公司开发了 MPPA (大规模并行处理阵列) 芯片和卡技术,以及数据处理单元 (DPU) 加速器。2022 年 1 月,Kalray 以约 1800 万欧元 (1850 万美元) 收购了英国 Arcapix 的全部股份,获得了其面向数据密集型工作负载的软件定义存储系统 Arcastream。
Arcastream 是一个统一系统,结合了存储软件、闪存、磁盘、磁带和云存储。现在 Kalray 正将其所有 Arcastream 资产转让给 DataCore。客户包括 Framestore、Red Bee Media 和伦敦帝国理工学院,Arcastream 还与 Dell 保持着持续的合作关系。
DataCore 的 CEO Dave Zabrowski 在一份声明中表示:"将强大的文件存储功能整合到我们的产品组合中,这次收购强化了我们作为通用存储领导者的角色 - 提供块存储、文件存储和对象存储,以无缝支持核心、边缘和云环境中的工作流程。"
DataCore 继承了 Arcastream 与 Dell 的协议,其软件被整合到 Dell EMC Ready Solution for HPC PixStor Storage 中。
Arcastream 软件主要面向娱乐、媒体、学术和高性能计算市场的客户销售。
去年 7 月,DataCore 筹集了 6000 万美元用于"推动 AI 技术的整合"。理论上,Arcastream 在为大语言模型提供数据方面存在 AI 发展机遇。如果这些应用发生在边缘站点,那么 DataCore 的 Perifery 业务也可能从中受益。
Kalray 还在寻求出售其 Ngenea 数据加速平台业务,该业务包括 DPU 处理器、加速卡及相关软件。去年 6 月,Kalray 与以色列加速卡和软件创业公司 Pliops 的合并谈判被叫停。目前尚未宣布 Ngenea DPU 业务的买家。
此次 Arcastream 的收购价格已经公布。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。