微软的Silica项目是一项将数据存储在玻璃中的研究计划,虽然这个想法本身并非全新,但其中包含了大量创新元素。该项目已经经历了多次迭代,探索如何在不同类型的玻璃基质中写入数据以及如何读取数据。目前,Silica项目可以在2毫米厚的硼硅酸盐玻璃板的数百层中存储2TB数据,采用飞秒激光脉冲技术和机器学习读取器。
这项技术的意义在于解决数字文化面临的真实问题:我们非常擅长生成和使用数据,但在长期保存数据方面表现糟糕。目前最经济的批量存储形式仍然是磁带,这种由薄塑料、粘合剂和金属氧化物组成的混合物并不耐用。
相比之下,玻璃是二氧化硅,基本上可以永久保存。燧石工具经过200万年依然完好如新,美索不达米亚的泥板经过3000年仍清晰可读。虽然我们还没有对硼硅酸盐玻璃进行一个世纪的测试,但保存1万年听起来是保守估计。
微软表示,在云规模部署的商业化玻璃光学存储是超可靠长期数据存储的唯一可行、可扩展解决方案。这个判断几乎肯定是正确的,但几乎肯定永远不会实现。
技术挑战巨大,比如每个激光束的写入速度为20Mbps,相当于USB 1.0水平。虽然可以通过多个并行飞秒激光束提高速度,但解码读取信号需要通过生成式AI模型处理。要扩展到处理每日生成的4亿TB数据并非易事。
然而,这并非不可能。我们现有的存储技术同样包含疯狂的技术创新水平,它们经过70年激烈竞争需求的演进,将出色的技术创新与持续改进相结合。但Silica项目没有这样的市场路径,没有可以立即满足的基本、普遍、紧迫的经济需求。市场缺陷在于,一旦销售了一个1万年的存储解决方案,很长时间内没人需要另一个。
Silica项目最大的问题是其乌托邦主义。声称它可以存储人类文明的所有数据,在巨大的玻璃救生艇中免受衰变和灾难影响,这种宣传很容易让人感觉良好。但超高科技档案的存在需要超高科技文化来读取它。否则,它就像等待柠檬浸纸巾交付才能启航的星际游轮一样无用。
假装可以从头重建是一种罪恶的分心,让我们无法面对这个白日梦本应改善的问题。就像马斯克强调建立多行星物种绝对必要性一样,这是一个类似的准救世主承诺。
科技创造者被指责读了太多科幻小说,实际上他们读得太少。从《基地》到《莱博维茨的赞歌》再到《银河系漫游指南》,保存数据拯救人类的主题从未奏效,总是具有欺骗性、无效性或短暂性。
请务必构建比巨石阵更持久的强大存储系统。我们需要这个,因为知识和历史比任何东西都重要。但要将其置于所有其他需要为真才能有用的事物的适当背景中,需要纪律、愿景和诚实才能使其可行。否则,这种希望将像玻璃心一样脆弱。
Q&A
Q1:微软Silica项目是什么技术?
A:Silica项目是微软研究的将数据存储在玻璃中的技术。它可以在2毫米厚的硼硅酸盐玻璃板的数百层中存储2TB数据,采用飞秒激光脉冲技术写入数据,用机器学习读取器读取数据。
Q2:玻璃存储比传统存储有什么优势?
A:玻璃是二氧化硅,可以基本永久保存。燧石工具经过200万年依然完好,美索不达米亚泥板3000年后仍可读取。相比之下,目前最经济的磁带存储由塑料、粘合剂和金属氧化物组成,耐用性较差。
Q3:Silica项目面临哪些技术和市场挑战?
A:技术上,写入速度仅为20Mbps,相当于USB 1.0水平,处理每日4亿TB数据存在困难。市场上,缺乏立即的经济需求,且一旦售出1万年存储方案,很长时间内无人需要另一个,投资回报周期过长。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。