12月14日,由中国信息通信研究院主办的2021新型数据中心研讨会在海口举行。在研讨会上,华为数据存储与机器视觉产品线副总裁董斐发表了《把握“新存储”五大趋势,助力新型数据中心建设》的主题演讲,系统地阐述了目前数据基础设施建设面临的五大主要挑战,以及新型数据中心存储领域的五大发展趋势。
中国数字经济高速发展,科技创新是跨越中等收入陷阱、从制造大国到创造大国的关键。数据是数字经济的关键生产要素和可再生的能源,数字经济和科技创新也产生大量数据。作为数据采集、存储、检索、管理、数据服务使能的数据基础设施,当前仍存在五大痛点:
第一,闪存介质在数据中心占比低,机械硬盘影响用户业务体验;
第二,数据中心不同业务系统普遍形成数据孤岛,不同业务系统间的数据共享耗时长、体验差、浪费能耗;
第三,数据中心存和算的能力不匹配,多算力投资,少存储投资,数据不足造成算力浪费;
第四,国计民生重点行业,承载重要数据的存储系统,灾备比例低;
第五,数据中心的高能耗,带来高成本和高碳排放。
今年7月工信部印发《新型数据中心发展三年行动计划》,大力推动新型数据中心建设。与传统数据中心相比,“新型数据中心”体现出“四新”的特征,即新计算,新存储,新网络,新能源。其中“新存储”着力解决五大痛点,呈现出“五”大产业趋势:
第一,产业升级,硅进磁退,加速全闪存对机械硬盘代际替换。全闪存原生存储产品,相比较机械硬盘存储产品,十倍提升数据访问性能和可靠性。据IDC统计,2020年全球闪存占比达到40%,其中发达国家超过50%,而我国仅为20%。新型数据中心要加速全闪存占比,加速全闪存对机械硬盘的代际替换。华为帮助浦发银行升级全闪存后,高峰时段交易速度提升6倍,空间占用降低50%,能耗降低72%。
第二,消除数据孤岛,建设统一存储资源池,协议互通,资源共享。传统数据中心IT建设以应用为中心,不同业务系统普遍形成数据孤岛,不同业务系统间的数据共享耗时长、体验差、浪费能耗。建设统一存储资源池,按需发放存储资源,数据免迁移跨系统共享,大幅提升数据访问效率降低TCO。例如在自动驾驶等高性能分析场景,支持多协议互通访问的存储资源池,同时满足仿真、分析、发布环节对数据的高效访问需求,实现数据零拷贝,分析效率提升25%,TCO降低20%。
第三,优化数据中心存算能力比,释放新型数据中心算力潜能。根据Gartner统计,过去5年,美国数据中心CPU加权算力和存储容量的能力比例是1:1,而我国是3:1。我国数据中心的算力和存储容量比例严重偏低,算力利用率普遍不足30%。新型数据中心应该优化存算能力比,提升算力和存储的资源利用率。
第四,数据灾备是新型数据中心刚性要求。新型数据中心关乎国计民生,水火无情、勒索病毒、恶意操作、天灾人祸带来极大风险,数据丢失、业务中断影响巨大。以美国为代表的发达国家,数据灾备占数据存储投资34%,而我国平均只有8%。新型数据中心的数据保护水平亟待提升,灾备建设时不我待。
第五,低碳节能、建设绿色新型数据中心是重要方向。据IDC测算,一块全闪存固态硬盘替换传统机械硬盘所带来的绿色效益,相当于植树150棵。全面推广全闪存存储,可使数据中心单位耗电量大幅降低。据业界分析数据中心搬移数据的能耗已经超过了计算的能耗,存算融合,从搬移数据到近数据处理,大幅减少数据中心搬移能耗。
演讲最后,董斐表示,基于数据中心新存储的五大发展趋势,华为将与产业界一起全方位支持和参与工作组的研发创新、标准制定、应用标杆等工作,全力支持新型数据中心建设,用最佳解决方案支撑三年行动计划落地,实现产业共赢,助力国家数字经济高速发展。
好文章,需要你的鼓励
本文探讨如何使用生成式AI和大语言模型作为倾听者,帮助用户表达内心想法。许多主流AI如ChatGPT、Claude等被设计成用户的"最佳伙伴",或试图提供心理健康建议,但有时用户只想要一个尊重的倾听者。文章提供了有效的提示词技巧,指导AI保持中性、尊重的态度,专注于倾听和理解,而非给出建议或判断。同时提醒用户注意隐私保护和AI的局限性。
北京大学团队开发出WoW世界模型,这是首个真正理解物理规律的AI系统。通过200万机器人互动数据训练,WoW不仅能生成逼真视频,更能理解重力、碰撞等物理定律。其创新的SOPHIA框架让AI具备自我纠错能力,在物理理解测试中达到80.16%准确率。该技术将推动智能机器人、视频制作等领域发展,为通用人工智能奠定重要基础。
人工通用智能和超级人工智能的出现,可能会创造出一种全新的外星智能形态。传统AI基于人类智能模式构建,但AGI和ASI一旦存在,可能会选择创造完全不同于人类认知方式的新型智能。这种外星人工智能既可能带来突破性进展,如找到癌症治愈方法,也可能存在未知风险。目前尚不确定这种新智能形态是否会超越人类智能,以及我们是否应该追求这一可能改变人类命运的技术突破。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。