EMC正在着手收购新兴企业TwinStrata公司及其云存储网关技术(即CloudArray),旨在为VMAX用户提供作为内置数据服务的公有云访问方案。
EMC的信息基础设施部门——也就是其核心存储业务所在——同时公布了新产品,即闪存高端企业级存储与向外扩展NAS产品线。
将有三款全新VMAX产品及其配套系统软件一同推出,此外新的Isilon与XtremIO产品也将陆续与广大用户见面。这里我们姑且将注意力集中在VMAX身上,Isilon与XtremIO方面的消息稍后将在其它文章中另行报道。
其重点在于为云与大数据方案添加规模化要素,同时对混合云机制加以扩展——即将内部云类型存储服务与公有云环境相对接。VMAX3将成为单一融合点,因此我们可以将其视为一套能够运行工作负载扩展集合且可以更好地访问并保护数据的存储阵列。
VMAX3将利用新的100K、200K与400K产品取代现有的10K、20K与40K机型。EMC宣称,这将帮助其客户实现企业应用程序的超合并目标。其高端400K机型拥有最高384个处理核心,针对闪存进行优化并提供超过“六个九”的高度可用性(即每年99.9999%正常运行时间)。
根据我们的推算,400K机型将能够支持最多七万套虚拟机系统。
VMAX3
其它值得关注的主要新消息还包括:
• 与现有VMAX产品相比,新一代版本性能表现增加三倍、总体拥有成本则降低50%。EMC目前将其称为企业数据服务平台,并表示它“能够帮助客户在数据中心或者公有云环境当中重新获得运行特定工作负载的控制权,”并能够将存储以“即服务”的方式加以使用。
• 发布HYPERMAX OS,这是一套融合型存储虚拟机管理程序与操作系统,它能够以实时与无中断方式向阵列内嵌入存储服务——例如云访问、数据移动与数据保护等等。从理论层面讲,我们认为任何EMC软件存储产品现在都可以运行在VMAX之上,VPLEX就是个很好的例子。
• 动态虚拟矩阵架构能够将不同存储引擎加以互连,同时通过动态分配存储引擎处理能力(即计算核心)来改进性能表现并确保规模化服务水平始终处于可预测状态。
• EMC ProtectPoint能够将直接指向Data Domain阵列的备份速度提升高达十倍,EMC表示它“不需要传统备份基础设施的配合,”例如媒体服务器以及备份软件等等。
• 高级FAST套件能够为VMAX资源带来一键式配置流程。
收购TwinStrata
此次收购案的具体数额尚未披露。位于马萨诸塞州纳蒂克市的TwinStrata公司成立于2007年,迄今为止其整体融资规模为1940万美元。如果按照五倍于融资数字的比例来计算,那么此番收购大约花掉了EMC公司一亿美元。目前惟一一家确定曾向TwinStrata注资的风投企业只有Avalon Ventures。
CloudArray是一台缓存设备,能够将全部数据容纳于其中,无论是基本信息、文件、离线备份或者归档内容可谓来者不拒,且能够根据管理策略自动将数据复制或者迁移到云环境当中。该设备支持公有与内部两种存储资源,包括Amazon S3与众多其它云服务供应商提供的存储服务。相信这份公有云支持清单将随着时间推移而更加丰富。
TwinStrata公司CEO兼联合创始人Nicos Vekiarides在一封公开信中表示:“我们正在积极将CloudArray与新的VMAX3企业数据服务平台相集成,旨在帮助大家以前所未有的无缝化方式实现工作负载自动分层,进而使外部存储容量扩展、数据保护与灾难恢复效果得到改进。”
实际上,VMAX目前已经拥有一套异构式云存储后端,这套公有云也将成为VMAX存储体系当中的一层。VMAX3还能够运行EMC的软件定义存储产品,从而直接为该阵列带来数据保护与存储基础设施服务。
我们期待着VMware VVOL的支持信息,但到目前为止还没有与之相关的新闻流出。
VMAX3以及HYPERMAX OS预计将于今年第三季度正式推出,届时将有更多功能逐步公开。嵌入文件与ProtectPoint将于今年第四季度面世,用户需要支付额外的许可费用方可享受其便利。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。