12月14日,由中国信息通信研究院主办的2021新型数据中心研讨会在海口举行。在研讨会上,华为数据存储与机器视觉产品线副总裁董斐发表了《把握“新存储”五大趋势,助力新型数据中心建设》的主题演讲,系统地阐述了目前数据基础设施建设面临的五大主要挑战,以及新型数据中心存储领域的五大发展趋势。
中国数字经济高速发展,科技创新是跨越中等收入陷阱、从制造大国到创造大国的关键。数据是数字经济的关键生产要素和可再生的能源,数字经济和科技创新也产生大量数据。作为数据采集、存储、检索、管理、数据服务使能的数据基础设施,当前仍存在五大痛点:
第一,闪存介质在数据中心占比低,机械硬盘影响用户业务体验;
第二,数据中心不同业务系统普遍形成数据孤岛,不同业务系统间的数据共享耗时长、体验差、浪费能耗;
第三,数据中心存和算的能力不匹配,多算力投资,少存储投资,数据不足造成算力浪费;
第四,国计民生重点行业,承载重要数据的存储系统,灾备比例低;
第五,数据中心的高能耗,带来高成本和高碳排放。
今年7月工信部印发《新型数据中心发展三年行动计划》,大力推动新型数据中心建设。与传统数据中心相比,“新型数据中心”体现出“四新”的特征,即新计算,新存储,新网络,新能源。其中“新存储”着力解决五大痛点,呈现出“五”大产业趋势:
第一,产业升级,硅进磁退,加速全闪存对机械硬盘代际替换。全闪存原生存储产品,相比较机械硬盘存储产品,十倍提升数据访问性能和可靠性。据IDC统计,2020年全球闪存占比达到40%,其中发达国家超过50%,而我国仅为20%。新型数据中心要加速全闪存占比,加速全闪存对机械硬盘的代际替换。华为帮助浦发银行升级全闪存后,高峰时段交易速度提升6倍,空间占用降低50%,能耗降低72%。
第二,消除数据孤岛,建设统一存储资源池,协议互通,资源共享。传统数据中心IT建设以应用为中心,不同业务系统普遍形成数据孤岛,不同业务系统间的数据共享耗时长、体验差、浪费能耗。建设统一存储资源池,按需发放存储资源,数据免迁移跨系统共享,大幅提升数据访问效率降低TCO。例如在自动驾驶等高性能分析场景,支持多协议互通访问的存储资源池,同时满足仿真、分析、发布环节对数据的高效访问需求,实现数据零拷贝,分析效率提升25%,TCO降低20%。
第三,优化数据中心存算能力比,释放新型数据中心算力潜能。根据Gartner统计,过去5年,美国数据中心CPU加权算力和存储容量的能力比例是1:1,而我国是3:1。我国数据中心的算力和存储容量比例严重偏低,算力利用率普遍不足30%。新型数据中心应该优化存算能力比,提升算力和存储的资源利用率。
第四,数据灾备是新型数据中心刚性要求。新型数据中心关乎国计民生,水火无情、勒索病毒、恶意操作、天灾人祸带来极大风险,数据丢失、业务中断影响巨大。以美国为代表的发达国家,数据灾备占数据存储投资34%,而我国平均只有8%。新型数据中心的数据保护水平亟待提升,灾备建设时不我待。
第五,低碳节能、建设绿色新型数据中心是重要方向。据IDC测算,一块全闪存固态硬盘替换传统机械硬盘所带来的绿色效益,相当于植树150棵。全面推广全闪存存储,可使数据中心单位耗电量大幅降低。据业界分析数据中心搬移数据的能耗已经超过了计算的能耗,存算融合,从搬移数据到近数据处理,大幅减少数据中心搬移能耗。
演讲最后,董斐表示,基于数据中心新存储的五大发展趋势,华为将与产业界一起全方位支持和参与工作组的研发创新、标准制定、应用标杆等工作,全力支持新型数据中心建设,用最佳解决方案支撑三年行动计划落地,实现产业共赢,助力国家数字经济高速发展。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。