设在爱沙尼亚的 Storadera 的宣传理念十分简单:利用优化的磁盘存储技术、采用更高容量的叠瓦硬盘,并在未来规划中引入 AI 优化存储操作,提供低成本、单层 S3 存储云服务。
首席执行官、创始人及前软件工程师 Tommi Kannisto 表示,他受到美国存储企业 Backblaze 的启发,认为自己可以在欧洲提供基于磁盘驱动的 S3 对象存储服务。Storadera 成立于 2019 年,并于 2021 年在爱沙尼亚塔林正式上线,2023 年在荷兰启用了第二个数据中心。
Storadera 以每月 6 欧元/TB 的价格提供其单层 S3 存储服务 —— 而 Backblaze 的基础价格为每月 6 美元/TB —— 且不收取任何附加费用。在欧元起售价比较中,Backblaze 实际上拥有最低成本,其 6 美元/TB/月折合约 4.75 欧元;不过,Storadera 位于欧洲,其存储数据不受非欧盟国家的直接管辖。
Storadera 的费用相较于 Wasabi 略低,而与 AWS 相比则显著更具优势,因为 AWS 还会对数据出口收取费用。
Kannisto 在英国的一次 IT Press Tour 活动中提到,Storadera 的年收入略低于 100 万欧元:“我们已经实现盈利……利润非常可观,而且每月收入增长约 5%。”
他进一步说明,Storadera 与数百款兼容 S3 的应用程序均能无缝对接。借助 Veeam 等备份工具接入 Storadera,客户可以将第二份备份发送至云端,从而延长备份保留期限,无需购买新的云存储管理工具。
目前,Storadera 拥有大约 100 家客户,其中包括爱沙尼亚政府和电信公司 Telia。经销合作伙伴约占其存储数据的一半,而来自 Veeam 的数据占约 50%,因此大部分数据均为备份数据。
数据存储在标准硬盘中,这些硬盘安装于 JBOD(单盘组)中,每个 JBOD 包含 102 个硬盘。每个 JBOD 都连接到配备 32 GB 内存的服务器上。服务器中运行的服务由 100,000 行 GO 代码构成。Kannisto 表示,这是一个超融合架构: “所有软件均在所有服务器上运行,所有服务器都向所有 JBOD 写入数据,并且没有负载均衡单元。”
各数据中心具备自治性,并支持存储桶地理复制。
Kannisto 采购的是常规的 Western Digital 硬盘(荷兰数据中心使用的为 26 TB 硬盘),并表示由于大部分负载为文件写入,叠瓦磁记录(SMR)硬盘由于其更高容量和可实现的磁盘写入优化,已被列入未来规划。Kannisto 预计:“SMR 将使我们的资本支出降低 25%。”
当被问到是否采用 QLC SSD 时,他表示:“目前 100 TB 以上的 QLC SSD 仍然过于昂贵 —— 而且在未来十年内可能仍然如此。” 他曾在博客中讨论过 SSD 与 HDD 的问题,并写道:“价格差异甚至可能超过 10 倍。如果我们能在成本低 10 倍的硬件上提供足够快速的服务,这无疑像魔法一样。”
他还指出:“SSD 的可写入总量(TBW)是有限的,超过后便只能处于只读状态;而硬盘则不受此类严格限制。”
Storadera 在写入数据时采用可变块大小机制。低负载时使用较小的数据块,而高负载时则通过批量小文件写入组成较大块。系统采用 4+2、6+2 以及即将推出的 8+2 残差编码方案,并将数据块在多台服务器间进行条带化存储。所有数据均经过加密处理,并通过对象锁定技术确保数据不可篡改。每 60 天,系统都会检查数据完整性,以防止位腐蚀。
该系统在处理 2 MB 文件时速度可达到近 300 MBps,在持续的数据流下,利用 HDD 实现高速写入十分容易。尽管元数据存储在 SSD 上,但其仅占硬盘容量的约 0.05%,因此写入速度并不依赖 SSD。
Kannisto 表示,Storadera 正计划扩大区域覆盖,今年年中将在德国启用一个数据中心,随后将进一步扩展至英国,再到美国或加拿大以及亚太地区,但具体时间尚未确定。
可能的技术发展规划包括利用 AI 优化存储操作以及采用智能缓存技术以提供边缘访问。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。