[中国,广州,2022年7月28日] 今日,以“共生、共创、共赢”为主题的第二届“华为数据存储用户精英论坛”在广州成功举行。在本次论坛上,华为围绕客户业务实际需求,全面阐述了数据存储产业“以数据为中心”的创新理念,通过突破数据存储的边界、突破数据保护的边界、突破数据管理的边界、突破产业合作的边界、突破绿色节能的边界,切实帮助企业解决业务问题,助力客户实现商业成功。
华为数据存储产品线副总裁庞鑫发言
华为认为,数据资源作为数字经济的关键要素,随着行业数字化加快,数据存储面临四大变化:
1. 数据应用多样化,从传统的数据库到大数据、人工智能,多样化数据应用蓬勃发展。
2. 数据存取实时化,数据热度不断攀升,数据分析处理的实时性要求越来越高。
3. 数据保护全面化,数据事故频发将造成严重经济损失,提升企业韧性是当务之急。
4. 数据节能常态化,迈向碳中和,数据的绿色节能成为数据中心零碳排的常态化要求。
华为数据存储产品线副总裁庞鑫表示,华为数据存储将积极拥抱这些变化,深入践行“以数据为中心”的理念,通过五个方面的突破,构建可靠存储底座,积极拥抱数字化时代日新月异的多样化数据应用。
1. 突破数据存储的边界,面向多样化的数据应用,存储将不再仅仅是数据的持久化载体,而是数据持久层和数据应用加速引擎相结合的数据基础设施。通过把元数据管理和密集的数据处理内嵌到存储系统中,形成多样化的数据加速引擎,实现最多10倍的端到端数据处理效率提升,帮助企业大幅提升客户体验和经营效率。
2. 突破数据保护的边界,提供从容灾、备份到防勒索保护的全方位数据保护,构建数据安全最后一道防线。华为OceanStor Dorado全闪存存储业界首家支持SAN&NAS 一体化双活(Active-Active);OceanProtect专用备份存储实现业界3倍备份带宽、5倍恢复带宽,极大缩短备份窗口;主存储+备份存储的全方位防勒索存储解决方案,保护企业免受勒索攻击带来的损失。
3. 突破数据管理的边界,构建“自动驾驶存储”。以前的存储管理多以人工操作为主,在数据量爆发式增长的今天已经不能满足管理效率要求,同时,以前的存储管理更多是设备管理,负责设备资源的发放、故障的监测和处理,现在存储管理正在由单纯的设备管理发展到数据管理,包括元数据管理、全局数据视图,全局数据调度,从而让数据中心的数据全局可视,同时实现数据智能分析、跨数据中心的协同。
4. 突破产业合作的边界,携手广大的合作伙伴,积极合作孵化分布式数据库存储、HPDA集群存储等商业解决方案,构建开放合作共赢、多层次的繁荣生态,共塑产业新未来。
5. 突破绿色节能的边界,将减少碳足迹的环保理念融入产品的全生命周期管理中,从生产制造端、产品使用端、行业应用端、生命周期末端,构建全生命周期的绿色低碳存储,持续助力数据中心绿色低碳。
用户声音是华为数据存储持续进步的源动力,创新的征程上需要用户广泛参与。庞鑫表示:“未来存储立足以数据为中心的软硬件架构,结合多样化数据应用加速引擎,实现10倍存储性能提升。华为数据存储将全方位倾听用户声音,让用户深度参与华为数据存储产品与解决方案的定义、优化、改进和实践分享,共同推动存储产业不断向前。”
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。