时至今日,在存储领域,除了超融合、SSD等热门概念外,另外一大看点无疑就是软件定义存储了。有研究人员称,从2014年到2019年,软件定义存储市场将从14亿美元增长到62亿美元以上,年复合增长率将达35%。因此,软件定义存储的优势显而易见。
软件定义存储最早的概念应该是来源VMware提出的软件定义数据中心里。在软件定义数据中心的概念里,数据中心中的服务器、存储、网络以及安全等资源可以通过软件进行定义,并且能够自动分配这些资源。存储作为数据中心不可或缺的一部分,起着至关重要的作用。
软件定义存储可以理解为对现有操作系统和管理软件的一个结合,能够完整的实现对存储系统的部署、管理、监控、调整等多个要求,让存储系统更加灵活、自由。
软件定义存储,虚拟化是基础。提到虚拟化,给大家脑补一下。其实虚拟化是一个既熟悉又复杂的词汇,在很大一部分场所指的是利用物理机的资源为众多虚拟机提供相应的隔离资源。实际上虚拟化是指一个资源池,例如,一个集群的所有资源都可以调度,存储资源的虚拟化,往往倾向于一个集群机器的存储资源的整合利用。
存储虚拟化可以归为软件定义存储的类别,两者也各不相同。存储虚拟化只有在专门的硬盘设备上应用,很多设备都是经过定制才能够进行存储虚拟化。而软件定义存储没有设备限制,简单的可以理解为存储的管理程序。
在软件定义市场既包括EMC、NetApp、IBM、惠普在内的业界知名厂商,也有名不见经传的Nexenta、Tintri、Solidfire等,各个厂商纷纷有自己的软件定义存储战略和产品。
经过近几年的市场动荡,市场上也出现了数家有代表性的厂商。由于市场上的存储厂商在实现软件定义存储技术上各有差异,我们无法穷尽所有厂商的表现,挑选几家有代表性的企业,盘点一下他们的表现吧。
VMware
去年2月,VMware推出新一代企业存储解决方案,其软件定义存储战略向前迈了一大步。为支持软件定义存储的大规模应用,VMware VirtualSAN6将为VMware屡获殊荣的超融合存储解决方案带来可扩展性与性能的显著提升,而VMware vSphere Virtual Volumes将提供更高级别的整合存储,支持第三方能够感知虚拟机。
EMC
ViPR是EMC的代表作之一。 EMC ViPR 是存储虚拟化软件平台,它将物理阵列中的存储(无论是基于文件、块还是对象)抽象为虚拟共享存储资源池,从而跨物理阵列实现灵活的存储使用模型,并提供应用程序和创新型数据服务。ViPR 从底层硬件阵列抽象出存储控制路径,以便可以在软件中集中执行多供应商存储基础架构的访问和管理。
NetApp
NetApp在“软件定义存储”话题上拥有更多的发言权,因为对NetApp存储产品来说,软件才是其核心价值的充分体现,所有的存储功能基于Data ONTAP存储管理软件的独特集群算法而实现。
NetApp的软件定义存储分为上层的虚拟应用,中间集群模式DataONTAP提供的虚拟化存储服务以及位于底层的硬件和云资源。而具体的底层的存储资源可以是NetApp的FAS和FlexPod。集群模式DataONTAP将NetApp的存储阵列与云连接起来,而FlexArray将FAS和E/EF以及第三方阵列联系起来。为了凸显软件的重要性,NetApp将集群模式DataONTAP作为一个核心,对底层的存储资源的整合和控制能力进一步加强,数据可以在集群模式DataONTAP所管理的不同存储介质中自由的进行迁移。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。