很长时间里,存储致力于打造一个高可靠、高性能的一个系统,然而架构复杂、成本昂贵、维护困难等问题愈发严重。另一方面传统存储所关心的问题主要集中在存储、冗余保护及资源共享三个方面。
那么当存储向应用靠了一步之后呢?存储厂商需要站在一个新的角度思考数据管理的问题。如果说传统存储的关键词在于性能和可靠性,那么未来存储将更注重对感知一词的实现。存储应该更为智能,更了解应用需求和数据生命周期。很明显,感知更符合大数据对于存储的需求,大数据最根本的要点在于挖掘数据价值,那么从存储的角度讲,就是需要将系统做的更为智能,不仅是需要根据冷热程度将数据存至不同的介质上,更需要按照数据从创建到销毁的整个过程进行管理,并且依据系统中应用需求动态的调整存储策略。
提出了感知引擎和智能引擎概念的同有,将两者落地到了自己的NCS12000上。感知主要是对系统负载、系统运行转台及数据冷热等信息的采集和整理,这些信息被整合成为智能引擎建模的基础,通过同有的核心算法和多年在存储系统优化上积累的经验,智能引擎能够建立一个新的资源配置方案,并且交付使用。NCS12000正是从应用的层次来考虑存储解决方案的一个典型案例,它不再局限于传统存储块或者文件存储的层面,而是向应用靠近了一步,思考怎样调整自身配置满足应用需求。
并非说存储不需要考虑数据保护和存储分层等功能,而是这些传统的功能都已经成为存储解决方案必须做到的基础。在此之上,未来存储还应充分挖掘软件的功能,使得存储更了解应用需求,这是未来存储也是数据中心的一个发展方向。同有日前发布了NCS12000等新一代存储产品,目前正在全国重点城市进行新品巡展。这代主打感知、智能、高效三个关键词的新品也将助力同有为中国存储市场开启一个新时代。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。