Western Digital 已投资于陶瓷归档存储片技术开发商 Cerabyte。
这一投资是在 Pure Storage 和 In-Q-Tel 的战略投资之后进行的。Cerabyte 的技术涉及使用飞秒激光在玻璃片的陶瓷涂层上烧蚀出纳米点孔。孔洞构成了类似 QR 型的数据图案,为每个存储片面提供 1 GB 的容量,并通过扫描显微镜进行读取。存储片被离线放置于货架上,由机器人系统负责将其运送至写入和读取站。其数据内容可在不可更改的状态下保存数百甚至数千年,且在离线时无需任何能量。这种存储方案的密度高于磁带盒,并能提供更快的数据访问速度。
Western Digital 首席战略与企业发展官 Shantnu Sharma 表示: “我们期待与 Cerabyte 合作,共同制定技术合作伙伴关系以推动这一技术的商业化。我们对 Cerabyte 的投资符合我们将产品推广至长效数据存储应用场景的战略重点。”
Western Digital 已经剥离了其 NAND 制造工厂和 SSD 单元 SanDisk,现在转型为一家专注于磁盘驱动器生产的企业。
Cerabyte 成立于德国,并于 2024 年夏季在硅谷以及科罗拉多州博尔德分别设立办事处,同时聘请了 Steffen Hellmold 担任董事,协助产品商业化。Hellmold 曾于 2016 年至 2021 年在 Western Digital 担任企业战略副总裁,并曾参与 DNA 存储技术,后在 Western Digital 之后加盟 Twist Bioscience。
Hellmold 表示: “此前人们认为只有 DNA 存储技术才能实现每机架存储 exabyte 级数据的可能。但 Cerabyte 同样可以在这一领域实现规模化。” 他的看法认为,Cerabyte 的技术比 DNA 存储更为实用、更接近商业化。
根据 Cerabyte 的介绍,其陶瓷数据存储技术有望实现新的应用场景,其总体拥有成本(TCO)优于当前的低温存储解决方案(如磁带)。Cerabyte 认为,长期永久数据存储必须具备价格合理、可持续、对 bit rot 具备抗性,同时不需要定期维护、环境控制或额外能耗来确保数据的可靠保存。
首席执行官兼联合创始人 Christian Pflaum 表示: “我们的陶瓷数据存储提供了一层至关重要且互补的长期数据存储方案,能够确保快速数据检索——通常可在几秒内完成——从而开启新的收入来源。我们非常高兴能与 Western Digital 合作,共同定义技术合作伙伴关系,推动我们大规模提供便捷永久存储解决方案的能力。”
该公司于 2023 年开发了一个示范原型系统,现正与制造合作伙伴合作打造商业产品,即构建一个图书馆系统,该系统包括读写驱动器、机器人系统、存储片货架、存储片装载与取出功能、用于管理与控制的软件,以及陶瓷存储片制造能力。
类似 Quantum 或 SpectraLogic 的公司可以利用其现有的磁带技术作为起点,协助开发一套陶瓷存储片图书馆系统。凭借制造磁盘盘片(这些盘片可采用玻璃基板)的经验,Western Digital 能在存储片生产方面提供支持,而且像 Pure Storage 一样,Western Digital 也拥有分销技术产品的渠道。
好文章,需要你的鼓励
UniR(Universal Reasoner)是一种创新的推理增强方法,可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发,该方法将推理能力分解为独立的轻量级模块,无需改变主模型结构。UniR的核心优势在于高效训练(仅更新小型推理模块)、出色的模型间迁移能力(小模型可指导大模型)以及模块组合能力(多个专用模块可通过logits相加组合使用)。在数学推理和翻译测试中,UniR显著超越现有微调方法,展示了轻量级模块如何有效增强大语言模型的推理能力。
Nebius团队开发了SWE-rebench,一个自动化管道用于从GitHub收集软件工程任务并进行去污染评估。该系统解决了两大挑战:高质量训练数据稀缺和评估基准容易被污染。通过四阶段处理(初步收集、自动安装配置、执行验证和质量评估),SWE-rebench构建了包含超过21,000个Python交互式任务的数据集,并提供持续更新的评估基准。研究发现部分语言模型在传统基准上的表现可能被污染效应夸大,而DeepSeek模型在开源模型中表现最为稳健。
这项研究提出了JQL(发音为"Jackal"),一种通过多语言方法提升大型语言模型预训练数据质量的创新系统。研究团队从拉马尔研究所等机构通过四阶段方法解决了多语言数据筛选的难题:先由人类评估内容教育价值创建基准数据,然后评估大型语言模型作为"评判者"的能力,接着将这些能力提炼到轻量级评估器中,最后应用于大规模数据筛选。实验表明,JQL在35种语言上显著优于现有方法,甚至能泛化到未见过的语言如阿拉伯语和中文,为多语言AI发展提供了高效可靠的数据筛选方案。
浙江大学和西湖大学研究团队开发的Styl3R实现了艺术风格化3D重建的重大突破,能在不到一秒内从少量未标定照片和任意风格图像创建具有多视角一致性的3D艺术场景。通过创新的双分支网络架构将结构建模与外观着色分离,系统不仅保持了原始场景结构,还准确捕捉了参考风格特征。与现有方法相比,Styl3R在处理速度和视觉质量上均显著领先,为创意内容制作开辟了全新可能。