SNIA的DNA存储联盟发布了一份52页的技术评估报告,深入分析了数据编码/解码技术、商业化就绪度指标以及未来面临的挑战。
DNA数据存储依赖于使用DNA链中四种核苷酸序列对数字信息进行编码。这四种核苷酸分别是腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T),它们存在于DNA生物聚合物分子的双螺旋结构中,位于所有生物体的细胞内。合成DNA能够以比其他存储介质小数个数量级的形式存储数据,并可保存数百年。它依赖分子层面的化学反应,这些反应比半导体中的电气操作要慢,这正是其核心挑战所在。
DNA数据存储已在研究项目中得到验证,但数据写入/读取速度以及设备尺寸、复杂性和成本都远未达到成功商业化产品的要求。这份技术文档全面审视了该领域,涵盖DNA编解码器、合成、存储和检索、测序以及商业化挑战等方面。
对挑战的分析揭示了五个主要问题:数据吞吐量、总体拥有成本、介质耐久性和数据保留指标、生物安全和数据安全,以及标准化。在吞吐量方面,报告指出:"传统存储中数据输入输出的要求远超当前生物技术应用场景中DNA写入和读取的能力。"
报告表示:"DDS(DNA数据存储)系统最根本的挑战是提高DNA写入和读取操作的吞吐量。DNA的底层写入和读取操作是相对缓慢的化学反应(高延迟),因此提高吞吐量的重点在于实现并行处理。"
报告建议:"DDS技术提供商必须提高底层写入和读取操作的吞吐量,同时减少分子在操作间移动所需的时间,并在此过程中为特定应用场景维持有竞争力的总体拥有成本。"
报告以乐观的语调结尾:"尽管DNA数据存储仍处于萌芽阶段,商业化仍面临重大挑战,但使用DNA进行数据写入、存储、检索和读取的基础已在可扩展技术平台上得到验证。此外,由生物和科学应用驱动的DNA技术持续投资将继续推动创新,增强DNA数据存储能力。"
DNA数据存储将补充而非替代现有的归档存储技术,"以可行的总体拥有成本解决泽字节规模和数据保存的'保存/丢弃'难题。"
报告称,DNA归档数据存储的应用案例将在未来三到五年内出现。
报告包含许多对于电子数字存储从业者来说陌生的术语,如同聚物、寡核苷酸、连接和聚合酶等,这是因为它涉及分子有机化学领域。该文档可免费下载,是DNA数据存储的优秀入门资料。
附注
DNA存储联盟是SNIA的一个社区组织,拥有约35名成员和六人董事会:
Esther Singer,DNA数据存储总监,Twist Bioscience
Stephane Lemaire,联合创始人兼高级创新官,Biomemory
David Landsman,行业标准总监,西部数据
David Turek,首席技术官,Catalog
Marthe Volette,技术总监,Imagene(以色列AI生物技术公司)
Julien Muzar,生命科学技术专家,Entegris(拥有8000名员工的半导体及其他高科技行业先进材料和工艺解决方案供应商)
Twist Bioscience是成员企业并拥有董事会席位,最近改变了其对DNA数据存储的立场。该公司将其DNA业务剥离为Atlas Data Storage,这是一家由HPE收购的Nimble Storage联合创始人兼CEO Varun Mehta领导的商业化初创公司。Twist保留所有权股份,Atlas在5月份完成了1.55亿美元的种子轮融资。我们预计Atlas将接管Bioscience的成员资格,可能还包括其董事会席位。
Esther Singer仍是Twist员工,担任产品和市场开发总监。我们认为,三家最重要的DNA存储技术公司是Biomemory、Catalog和Atlas Data Storage。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。