7月5日,2023全球数字经济大会拉萨高峰论坛拉开帷幕。曙光作为“东数西算”的重要建设者,参与了此次论坛。会上,中科曙光存储科技有限公司副总裁张新凤,发表了“东数西存,支撑数字经济新格局”的主题演讲。张新凤表示:“曙光存储以先进存力,把握东数西存数据应用新趋势,为数字中国的建设发展打造坚实的数字底座。”

中科曙光展位
自十四五数字经济规划以来,“东数西算”工程已全面落地实施一周年。随着数字中国的建设发展,“东数西渲”、“东数西训”等多元化、场景化应用需求不断涌现,促使算力、存力的需求激增。据统计,2022年底我国总算力规模达180EFLOPS,存力总规模超过1000EB。数据是算力的基石,算力依赖存力。想要算好海量数据,就要先保证数据存得下,计算时读得快,因此“东数西算”的实质更多地表现为“东数西存”。随着“东数西算”工程的逐步深入,存力的根作用也将不断凸显。
在前沿技术与数据应用发展的趋势下,未来存力将面临高性能、大容量、安全可靠等新挑战。张新凤认为,未来统一存储底座会是基础,在EB级扩展、融合业务场景的多协议支撑、极致性能优化等方面发挥重要作用。为此,曙光存储以融合、智能、高效、海量、绿色为核心的先进存力,促进东西部的计算与存储资源有机结合,推动各枢纽节点建设尽快落地生效。从而实现东数西算存力的统筹调度,进而提高数据中心的存算效率,降低成本和能耗。
作为国内分布式存储系统的领军企业,曙光已拥有300+项专利、9+个百PB级应用案例、IO500性能稳居世界领先水平,在赛迪最新发布的《中国分布式存储市场研究报告(2023年)》中,曙光位居领导者象限。业务涵盖运营商、能源、金融、交通、气象、生物信息等多个领域,帮助千行百业应对数据密集型应用场景下,数据存储、性能、效率的挑战。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。