三家磁盘驱动器巨头外加八家其它IT供应商已经建立起一个新的联盟体系,旨在推动直接寻址对象存储技术的普及——具体而言,也就是能够以键值方式存储数据的磁盘驱动器产品。
这十一家企业共同建立起Kinetic开放存储项目(简称KOSP),而此项目也以协作项目的方式加入到Linux基金会当中。这十一家供应商分别是:
· 希捷公司,他们也是率先在Kinetic磁盘驱动器当中尝试以太网访问键值存储机制的企业。
· 东芝公司,也拥有自己的以太网键值存储驱动器产品。
· 西数公司,其旗下之HGST子公司拥有自己的直接寻址对象存储磁盘驱动器技术。
· 思科公司。
· Cleversafe公司,一家对象存储软件供应商。
· 戴尔公司,其与Scality方面达成了分销合作关系。
· DigitalSense公司。
· NetApp公司,旗下拥有StorageGRID对象存储产品。
· Open vStorage公司。
· 红帽公司。
· Scality公司,旗下拥有RING对象存储软件产品。
Exablox公司,其自东芝发布相关方案以来就表示支持,不过并未出现在本次KOSP联盟名单当中。
KOSP希望打造一套“立足于下一代以太网存储设备的开源对象存储方案”。换句话来说,软件与系统将在访问希捷、东芝以及西部数据的以太网键值存储磁盘时遵循一套标准化键值存储机制,而不必再应对三种彼此独立的接入协议以及数据移动方式。
很明显,这项技术的进一步发展需要一套通用性的访问协议及语义概念。在新规范的引导下,我们将拥有开发完成的API、开源库以及模拟器成果,从而使得软件及系统开发人员能够打造出新型应用程序,同时对现有应用加以修改从而使用并管理键值存储磁盘驱动器。
其基本思路在于,一套存储阵列——例如作为基础设施资源存在的文件管理系统配伍方案——包含有一套文件系统、服务器当中进行数据往来的应用程序再加上目标磁盘驱动器。如果希捷及其它磁盘厂商的磁盘驱动器能够为服务器软件所直接管理,也就是利用Get与Put对象型语义实现访问,那么整个执行流程将变得更为高效。这样一来,服务器应用到磁盘驱动器构成的整体堆栈也将得到显著简化。
虽然理论情况确实如此,但对磁盘驱动器加以管理并追踪哪些数据被保存在具体哪块驱动器上仍然是件麻烦的任务。非常奇怪的是,各对象存储补仓企业似乎并没有看到市场对于这项技术的需求并着手开发,反倒是三大磁盘驱动器供应商——他们当然希望借此销售自己的磁盘产品——在积极推进这项工作,目前东芝与西部数据旗下的HGST也在紧跟着希捷的发展脚步。
希捷公司与HGST凭借着各自推出的磁盘驱动器阵列积极助力这一趋势,其一为来自希捷的ClusterStor、其二则是HGST打造的Active Archive System。
目前还没有任何迹象表明这一技术概念已经得到大规模普及,而且只有少数JBOD类型的机箱能够容纳这类驱动器方案,例如Rausch推出的产品。希捷公司表示,SuperMicro与戴尔双方已经同意为这些新型驱动器制造配套外壳。SNIA公司则组织起一个工作小组,旨在研究相关概念并开发出一套基于对象的存储设备(简称OSD)实施规范。
也许在未来的发展过程中,键值存储磁盘驱动器将在超大规模数据中心运营商市场上寻得理想的生存空间,并在这里承担起大量非结构化、变量型数据。这类客户往往乐于享受出色的传输速度以及大批量直接寻址驱动器所带来的管理便捷性。不过这类驱动器恐怕无法在企业级数据中心内找到适合自己的舞台,因为在这里人们需要处理的多数仍然属于文件型数据,而买家最看重的是驱动器阵列控制器以及磁盘驱动器管理软件的易用性。
KOSP成立的消息目前已经正式传出,不过KOSP联盟本身还没有构建起任何官方网站或者提供相关介绍资料。
为了避免大家的混淆,我们还要最后强调一句:KOSP跟微软建立的OpenKinect项目一点关系也没有。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。