如果说高端存储一直是存储行业“皇冠上的明珠”,那么曙光存储刚刚完成了一次震撼全球的"摘冠"壮举。
最近,曙光存储集中式全闪FlashNexus以32控、超3000万IOPS的卓越性能和0.202ms的极致时延,在国际存储性能委员会(SPC)的SPC-1 v3基准测试中强势登顶,刷新全球纪录。值此中科曙光成立30周年之际,这一里程碑式的成就,不仅是曙光存储在技术上的重大突破,更是自主创新的中国科技再攀高峰的标志。
作为存储领域的"奥林匹克",SPC-1测试覆盖OLTP、数据库等关键业务场景,对存储系统的稳定性、扩展性及性能提出了近乎严苛的要求。SPC-1是一个综合模型的测试,主要衡量存储系统在随机IO负载下的综合性能表现,模型将存储隔离成三块,通过模拟企业关键业务场景(如数据库、OLTP、电子邮件和系统应用等)测试存储系统的随机读写性能和处理复杂业务请求的能力。
凭借“迅若闪电”的性能设计、“安如磐石”的高可靠保障,以及“智若洞见”的AI智能内核驱动,曙光存储集中式全闪FlashNexus已经成为存储领域的“超跑”。
解密FlashNexus三大杀器
SPC-1测试过程分为四个主要阶段:第一,持久性测试:以100%压力(例如3000万IOPS)连续运行8小时,考验系统在极限负载下的稳定性;第二,坡度压力测试:压力从100%逐步降至10%,再回升至100%,每个梯度运行15分钟,观察系统在压力变化下的时延和稳定性表现;第三,可重复性测试:压力从10%瞬间跳升至100%,运行15分钟后再降至10%,反复多次,验证系统在业务大幅波动下的处理能力。第四,可靠性测试:模拟断电恢复场景,对所有控制器和主机下电后重新启动,校验数据一致性。
SPC-1测试对性能的要求主要体现在两方面:第一,IOPS越高,系统处理并发请求的能力越强,3000万IOPS意味着它能够高效应对高并发业务负载。第二,时延是衡量单个请求响应速度的关键指标。0.202ms的时延,表明其在响应速度上具有显著优势。
“FlashNexus的设计目标是为了在AGI时代,性能和容量需求呈指数级爆发时,解决存储系统面临的新挑战。”曙光存储全闪产品总监卫然说道。
“迅若闪电”性能方面,通过“盘、框、控”三者的高效协同,最大化系统性能。例如,智能硬盘框利用自身的计算能力分担部分CPU负载,让控制器更专注于IO调度,提升整体效率。跟盘协同通过与国内主流SSD厂商合作,将SSD的“智能多流”“盘内垃圾回收”等特性与存储软件深度融合,从系统层面精准调度每块盘的行为,充分发挥介质性能优势。
“安如磐石”可靠性方面,构建了从部件级到系统级再到方案级的多维度保障体系。部件级:采用独创的RAID QC(四盘校验)技术,支持存储池内同时故障四块盘仍能保证数据不丢失、业务不中断。同时,通过随机写入数据化技术,降低高RAID级别下的写入惩罚,完美匹配大容量SSD时代的可靠性需求;系统级:提供跨存储集群的AA对称双活和异地复制方案,确保业务连续性;方案级:支持两地三中心或四中心的多级容灾架构,让数据保护方案更全面、更立体。
“智若洞见”智能存储方面,内置AI驱动的性能调度引擎和异常检测引擎,实现智能化管理。性能调度引擎可以实时感知系统负载和业务优先级,动态分配硬件资源。关键业务可独享性能通道,非关键业务则智能限流,提升资源利用率。异常检测引擎可以毫秒级定位系统故障和性能波动,精准预测硬件老化等潜在风险。结合数据保护和容灾架构,实现从数据校验到访问路径切换再到冗余重建的全链路自愈能力,大幅降低故障恢复时间。
曙光在产品架构设计和前期规划中,始终围绕这三个方向展开,将多样化的需求整合为可复用的目标。所以FlashNexus主要应用于关键负载场景,包括金融、通信、能源、医疗等关乎国计民生的核心业务领域。
曙光存储测试架构师晁中元指出,单套FlashNexus存储的32控和3000万IOPS性能对单一数据库或应用系统来说可能“过剩”,但其强大的扩展能力允许用户通过单一存储系统同时支撑多个类似业务。这种资源整合的方式不仅为每个业务系统提供了良好的性能保障,还提高了存储容量的利用率,降低了运维复杂度,带来更高的性价比和更便捷的管理体验。
数据显示,FlashNexus实现每千IOPS成本仅155.01美元,这不仅为用户提供了更优的选择,也推动了中国存储产业向高端化发展的进程。
同时在硬件选型上,曙光存储一直秉持开放合作的态度。,与国内生态伙伴紧密合作,充分发挥各自领域的技术优势。通过这种深度耦合的合作模式,才能打造出性能更强、自主可控的高端存储产品,同时推动国内存储产业链的整体升级。
从双态IT到AI存储革命
过去企业在“互联网+”转型中,企业IT架构使用的是双态IT方法论,其将工作负载分为稳态和敏态,稳态业务数据量相对稳定,但对响应速度和低延迟要求较高,类似于“马拉松运动员”。这类业务通常由集中式存储支撑,其架构稳定、延迟低,但扩展性有限。敏态业务数据量增长迅速,对系统扩展性和大规模并发处理能力要求较高,类似于“短跑运动员”。这类业务通常由分布式存储或云存储支撑,其扩展性强,但对单笔业务的响应要求相对较低。
到了AI时代,大模型需要进行训练和推理两种工作:训练阶段:类似于敏态业务,数据量庞大,但对单笔数据的延迟要求相对宽松。推理阶段:类似于稳态业务,数据量较小,但对延迟和IOPS(每秒输入输出操作数)的要求极高。
这种变化催生了新的存储需求,即一套系统需要同时支持稳态业务的高速响应和敏态业务的高扩展性。
而且随着AI的爆发,算力需求激增,使得GPU集群规模不断扩大,存储就会逐渐成为瓶颈。此时,存储性能的每一点提升都会显著提高生成式AI的投资回报率,所以企业对存储性能的需求也从“稳定”转向了“极致”。
曙光存储副总裁郭照斌看到,下一阶段存储系统将呈现出两大特点,第一,单套系统能够敏锐感知不同的业务模式,并提供最匹配的存储资源支持;第二,在支持工作负载灵活性的基础上,提供更极致的性能体验。例如,曙光集中式全闪存储领跑SPC-1、分布式存储登顶IO500,都验证了其系统在极致性能方面的表现。
回望来时路,在闪存和高端存储领域,曙光存储一直追求的最终目标是硬件与硬件的深度融合,最大限度发挥硬件性能。例如,通过网络与硬盘的直接通信,减少甚至避免软件层的干预,从而在性能上实现更大优化。
历经20年的技术积累,曙光存储始终坚持独立自研的理念,从代码到架构完全自主可控。在技术领域坚持实事求是,紧跟新技术发展趋势,结合产品和市场需求,进行创新性设计,确保每一行代码都承载着曙光的原创精神。
未来,曙光存储将继续坚持自主研发,依托国内存储技术的最新成果,包括处理器、介质和网络,持续突破技术瓶颈。就像SPC-1这场竞赛的终极目标不是为了“秀肌肉”,而是在为产业立标杆。
好文章,需要你的鼓励
OpenAI 宣布重大升级:ChatGPT 现可记忆用户全部历史对话,并据此调整回复。这项功能将使 ChatGPT 随时间更了解用户,提供个性化响应。新功能包括"引用保存的记忆"和"引用聊天历史",目前仅向付费用户开放。虽然提升了实用性,但也引发了隐私方面的担忧。
本文探讨了人工智能聊天机器人对人类情感和关系的潜在影响。作者指出,虽然AI可以模仿关怀,但缺乏真实情感,可能导致人们对亲密关系的期望发生改变。特别是对儿童来说,过度依赖AI可能阻碍情感发展。文章呼吁我们要警惕AI带来的长期影响,保持人际交往的真实性。
AI革命的下一波浪潮不仅仅关乎拥有AI技术,更在于拥有能让AI真正理解业务的人才。虽然媒体关注的是构建大语言模型和复杂AI代理的工程师,但在前瞻性公司的分析部门中,一场悄然革命正在酝酿:AI分析师的兴起。这个角色将成为连接AI技术与业务实践的关键纽带,对企业数字化转型至关重要。
Google 推出了 Firebase Studio,这是一个基于云的人工智能辅助开发环境。它结合了 Project IDX、GenKit 和 Gemini 等技术,旨在帮助开发者快速原型设计和构建应用程序。然而,一些开发者反馈称,目前该工具的 AI 功能还不够成熟,难以生成高质量的可用代码。这表明 AI 辅助开发工具虽有潜力,但仍无法完全取代专业开发人员的技能和经验。