三家磁盘驱动器巨头外加八家其它IT供应商已经建立起一个新的联盟体系,旨在推动直接寻址对象存储技术的普及——具体而言,也就是能够以键值方式存储数据的磁盘驱动器产品。
这十一家企业共同建立起Kinetic开放存储项目(简称KOSP),而此项目也以协作项目的方式加入到Linux基金会当中。这十一家供应商分别是:
· 希捷公司,他们也是率先在Kinetic磁盘驱动器当中尝试以太网访问键值存储机制的企业。
· 东芝公司,也拥有自己的以太网键值存储驱动器产品。
· 西数公司,其旗下之HGST子公司拥有自己的直接寻址对象存储磁盘驱动器技术。
· 思科公司。
· Cleversafe公司,一家对象存储软件供应商。
· 戴尔公司,其与Scality方面达成了分销合作关系。
· DigitalSense公司。
· NetApp公司,旗下拥有StorageGRID对象存储产品。
· Open vStorage公司。
· 红帽公司。
· Scality公司,旗下拥有RING对象存储软件产品。
Exablox公司,其自东芝发布相关方案以来就表示支持,不过并未出现在本次KOSP联盟名单当中。
KOSP希望打造一套“立足于下一代以太网存储设备的开源对象存储方案”。换句话来说,软件与系统将在访问希捷、东芝以及西部数据的以太网键值存储磁盘时遵循一套标准化键值存储机制,而不必再应对三种彼此独立的接入协议以及数据移动方式。
很明显,这项技术的进一步发展需要一套通用性的访问协议及语义概念。在新规范的引导下,我们将拥有开发完成的API、开源库以及模拟器成果,从而使得软件及系统开发人员能够打造出新型应用程序,同时对现有应用加以修改从而使用并管理键值存储磁盘驱动器。
其基本思路在于,一套存储阵列——例如作为基础设施资源存在的文件管理系统配伍方案——包含有一套文件系统、服务器当中进行数据往来的应用程序再加上目标磁盘驱动器。如果希捷及其它磁盘厂商的磁盘驱动器能够为服务器软件所直接管理,也就是利用Get与Put对象型语义实现访问,那么整个执行流程将变得更为高效。这样一来,服务器应用到磁盘驱动器构成的整体堆栈也将得到显著简化。
虽然理论情况确实如此,但对磁盘驱动器加以管理并追踪哪些数据被保存在具体哪块驱动器上仍然是件麻烦的任务。非常奇怪的是,各对象存储补仓企业似乎并没有看到市场对于这项技术的需求并着手开发,反倒是三大磁盘驱动器供应商——他们当然希望借此销售自己的磁盘产品——在积极推进这项工作,目前东芝与西部数据旗下的HGST也在紧跟着希捷的发展脚步。
希捷公司与HGST凭借着各自推出的磁盘驱动器阵列积极助力这一趋势,其一为来自希捷的ClusterStor、其二则是HGST打造的Active Archive System。
目前还没有任何迹象表明这一技术概念已经得到大规模普及,而且只有少数JBOD类型的机箱能够容纳这类驱动器方案,例如Rausch推出的产品。希捷公司表示,SuperMicro与戴尔双方已经同意为这些新型驱动器制造配套外壳。SNIA公司则组织起一个工作小组,旨在研究相关概念并开发出一套基于对象的存储设备(简称OSD)实施规范。
也许在未来的发展过程中,键值存储磁盘驱动器将在超大规模数据中心运营商市场上寻得理想的生存空间,并在这里承担起大量非结构化、变量型数据。这类客户往往乐于享受出色的传输速度以及大批量直接寻址驱动器所带来的管理便捷性。不过这类驱动器恐怕无法在企业级数据中心内找到适合自己的舞台,因为在这里人们需要处理的多数仍然属于文件型数据,而买家最看重的是驱动器阵列控制器以及磁盘驱动器管理软件的易用性。
KOSP成立的消息目前已经正式传出,不过KOSP联盟本身还没有构建起任何官方网站或者提供相关介绍资料。
为了避免大家的混淆,我们还要最后强调一句:KOSP跟微软建立的OpenKinect项目一点关系也没有。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。