ChatGPT大模型应用的火爆,让业界把目光再次聚焦到了人工智能应用上,人工智能好不好用,由包括数据、算力和算法三大要素决定。而支撑着三大要素的底座就是包括服务器、存储和网络等组成的数据基础设施。
至顶科技推出的系列访谈节目《论存储新技术 道数据新价值》,继续邀请西部数据和他的伙伴一起聊聊数据背后的故事。本期节目,宝德计算机系统股份有限公司总经理马竹茂、西部数据中国区技术支持高级总监宋磊和至顶科技总经理高飞针对目前火热的ChatGPT为切入点,一起畅谈人工智能技术和应用的发展带来的数据机遇以及背后需要怎样的数据基础设施。
AI带来的数据新机遇
要实现数据价值,必须发挥好人工智能三个核心要素算力、算法和数据。“我们如果把人工智能的应用想象成一个强大的机器,它的算法就是机器的引擎,算力是推动这个引擎的加速器,关键的数据其实就是让这个引擎能够正常运转必不可缺的燃料。” 西部数据中国区技术支持高级总监宋磊这样解释AI三要素之间的关系。
而围绕数据、算力和算法的IT基础设施这些年也在不断创新发展。我们从宝德服务器二十多年的发展就可以看出相关变化,从早期的PC为中心的局域网对于服务器的单点需求,到2007年,乔布斯推出了智能手机以后,开启了移动互联网时代,一方面催生了云计算和数据中心的发展,另一方面产生了大量的非结构化数据,对数据中心的存储需求越来越大。单个服务器的硬盘数量也从早期的两块硬盘增加到了现在的24块、48块大容量硬盘。
于此同时,Gartner预测到2025年,基于 AI的内容生成的数据将占到整个数据量10%。 “AI的发展利好服务器和存储市场,包括像ChatGPT的应用,会对算力要求越来越高,背后需要海量的AI服务器。随着国内相关大模型应用的推出,对服务器需求会越来越大,所以对宝德科技而言,是非常大的利好。” 宝德计算机系统股份有限公司总经理马竹茂表示。
面向AI,数据基础设施新挑战
如今在“3060”双碳目标的背景下,明确规定了数据中心能耗效率值(PUE),比如“东数西算”工程对数据中心PUE值提出了明确要求:西部要低于1.2,其他地区要低于1.25,而示范项目要低于1.15。于此同时,现在一年产生的数据比人类过去几千年产生数据总和还要多。结合当下的AI应用的爆发,对服务器的设计和创新产生新的挑战。
“简单来说,AI应用给服务器带来两大挑战:一个费电、一个费钱。” 马竹茂讲到。费钱指的是生产过程中的成本挑战,通用服务器以CPU为核心,人工智能服务器包括GPU、TCU、NPU、XPU、FPGA等加速卡,过去一台服务器几万人民币,现在添加一块加速卡有时候就几万人民币。
费电指的是使用过程中的功耗挑战,人工智能服务器里面除了CPU、几十块硬盘之外,还包括GPU等加速卡,每台服务器如果都进化到AI服务器,那么从CPU到GPU会增加上几百亿个晶体管,增加几百瓦的发热功耗,那么对上万台甚至数十万台服务器的数据中心的能耗就形成了很大挑战。” 马竹茂解释到。
而AI时代,不仅数据量爆炸式增长,而且对数据质量要求也越来越高。以ChatGPT 4.0来举例,它在训练时候使用到了45TB的数据,有近一万亿个数据量,数十亿行的源代码。大家都惊叹于ChatGPT流畅互动的界面,其背后是海量的知识量以及需要处理海量数据的算力。 “本质上讲数据的数量和质量决定了人工智能整体的落地水平。” 宋磊分享到。
要实现海量数据的存储和数据高质量的提取,不仅考验算力,也对硬盘的性能、容量、延迟等方面都提出更高的要求。“结合人工智能应用从数据角度来说,它的训练需要海量数据尤其是PB级的数据,需要更大的存储容量,同时在训练过程中这些数据写得少,读得多,还需要更高的吞吐量,以及对延迟、性能都有更高的要求。” 宋磊讲到。
面对AI新挑战,双方携手破局之道
一方面AI服务器面临的能耗挑战、成本挑战,另一方面在数据层面还面临对于大容量、高性能的存储需求,因此如何构建绿色高效、高速共享的AI服务器架构成为双方的应对之道。
“要打造智能化的计算平台,宝德发挥CPU+GPU异构设计优势,完成了人工智能训练和推理、高密度系列和大容量存储系列相关产品的扩展和升级,并且加大在自主研发、方案优化、专业服务和智能生产等方面的投入。”马竹茂表示。
针对功耗和成本,宝德AI加速服务器采用第四代英特尔至强可扩展处理器,来提供强大的计算能力,支持DDR5、PCIe 5.0和HBM,性能提升高达50%;同时可以支持24个2.5”SATA/SAS/NVMe和2个后置2.5 ”SATA/SAS热插拔硬盘,支持内置1个M.2(NVMe/SATA),保障了整机性能的强劲可靠;面向CPU+GPU异构设计,还具有智能散热系统,可以根据热关键器件的温度综合调节风扇转速;并支持液冷散热方案,可以有效减少数据中心客户的整体碳排放,显著降低客户TCO(总体拥有成本)。
面向AI应用,西部数据也用创新的思维重新审视存储的架构,根据数据的使用频率和场景,通过对数据进行分层存储,来实现成本、性能、能耗和扩展之间的平衡。
具体而言将数据分为极热数据、热数据、温数据、冷数据和极冷数据。极热存储适用于内存DRAM;热存储方面,用户希望快速访问高价值数据,进行业务的预测或决策等,适用于高性能SSD;温存储则代表了读取较频繁,有较高性能IOPS和带宽要求,主要以主流SSD或HDD为主;冷存储则是少量写入,多次读取,适用于高密度大容量的企业级硬盘,目前西部数据已推出22TB CMR HDD;极冷存储则用于大块写入,写入次数较少的数据保存,可以用SMR HDD来满足需求, 其最高容量能达到26TB。
以西部数据推出的HelioSeal氦气密封技术为例,西部数据Ultrastar系列企业级硬盘HDD 采用的第7代充氦气密封技术,实能够实现了更低功耗带来(W/TB) 更高功效。不仅如此,氦气填充硬盘还因为内部填充氦气,外部密封的独特优势,甚至能够在全浸没式液冷环境中稳定运行。实现了超大规模、云和企业级存储环境下,在提供高容量的同时,减少热排放,支持双碳减排;同时降低系统散热设计复杂性来实现运营成本的降低。
“通过数据分层存储,可以更好的和宝德这样的行业领先的解决方案提供商一起重新审视存储架构,一起为客户提供按需分配的创新的存储解决方案。” 宋磊讲道。
访谈最后,双方表示将继续在产品、技术、市场等方面进行持续合作。在产品上,西部数据会第一时间把最新的产品应用到宝德的服务器上;在技术上,双方联合实验室持续优化解决客户面临的存储问题。“硬盘很小,但是很复杂和精密,服务器上的风扇选的不对,风力都会影响到机械硬盘的稳定性、读写速度。” 马竹茂讲到。在市场上,双方将联合推进包括巡展、客户交流等市场活动。实现通过全面合作,来持续为用户提供领先的解决方案,加速企业数字化转型。
欢迎观看完整版视频,了解更全面的内容:
https://www.zhiding.cn/special/westerndigital_2022_PowerLeader
好文章,需要你的鼓励
智谱AI率先推出了 AutoGLM,试图打造一款能够理解、规划、执行,并最终实现“无人驾驶”操作系统的 AI Agent。
该处理器采用16nm工艺技术设计,拥有 48 个ARM Cortex-A75内核,六通道DDR4 3200 MHz 内存 - 每插槽高达 768 GB(每通道 128 GB)
谷歌DeepMind研究人员则直接把这项技术集成到AI Agent中开发了Talker-Reasoner框架,让其具备“快”、“慢”两种拟人化思考方式。
数据密集型工作负载的激增,导致计算系统需要处理的数据量大幅增加。这种不断拓展的数据环境,迫切需要具备更大容量和更高带宽的