如今,人工智能/机器学习、金融应用和边缘计算架构等万亿级应用无处不在,而且不仅仅存在于大型组织中。这些应用将数据量推向前所未有的水平,因此需要大量存储,以及一个如何在不消耗整体IT预算情况下持续确保性能的计划。
许多IT领导者认为,对他们来说最具成本效益的存储选择是固态盘(SSD),而不是硬盘驱动器(HDD)。
但这真的如此吗?正如数据中心运营商所知,电力、冷却/加热、房产和其他总体拥有成本(TCO)方面的考虑因素超出了那些必须考虑到的前期软件和存储介质等成本。
来自各种驱动器和存储设备厂商和、分析师和顾问的分析表明,即使受到QLC闪存技术和存储密度改进等创新成果的推动,SSD并不总是具有优势的。
让我们看看以下这三类应用以及针对每一类型应用使用硬盘驱动器和固态盘的注意事项。
应用1:延迟敏感分析
闪存最适合以下情况:
闪存固态盘通常特别适合于那些需要随机访问小数据负载的应用。例如,在执行链中的下一步之前,对产品订购系统进行任意查询并使用密钥(例如客户姓名或电话号码)查找客户记录的事务系统来说,SSD较低的延迟可以使其从中受益,边缘应用也是如此,在这种应用中,小型物联网或设备传感器事件流的每条事件数据记录承载了千字节,尤其是在工作负载规模较大时。
在这些情况下,闪存SSD要比HDD更具优势,因为闪存SSD具有更低的延迟和更高的每秒操作数(IoP)。在这些情况下,QLC闪存的密度是现有TLC闪存的两倍,可以提供更高的性能。
当HDD可能是更好的选择时:
IT领导者不能假设每个延迟敏感型应用都需要SSD。企业经常会发现,通过在基于HDD的系统上运行高IoP、延迟敏感型工作负载,特别是那些针对服务器和数据中心工作负载优化了企业级HDD的系统,可以获得足够的性能。数据归档就是其中一个很好的例子。
在归档、备份和媒体资产管理等应用中,毫秒级和微秒级延迟之间的差异通常不会影响最终用户的性能。在这些情况下,HDD可能是更好的选择,因为HDD可以满足IT对于在符合性能预期或者超出预期的同时、仍然处于预算范围内这二者之间的平衡要求。
应用2:拥有PB级非结构化数据情况下对TCO的考量
最近,业界就高密度闪存SSD或者HDD是否更适用于非结构化数据应用(例如富媒体文件或传感器数据)存储展开了争论。SSD支持者认为,最新版本的闪存在容量成本方面实际上能够与HDD“持平”,甚至有人预测高密度闪存SSD将很快取代HDD,因为前者可以更好地完成所有任务。
然而,如今高密度SSD在性价比方面还无法完全取代HDD,特别是在作为整个应用工作负载的PB级非结构化数据存储的时候。通过结合闪存和HDD来实现各自优势,我们通常可以实现性能、长期耐用性、容量和经济性的理想组合,这实际上是要针对特定情况利用每种存储介质的优势,并选择最适合每种工作负载的恰当的存储介质。
在提供大规模可靠性方面,HDD可能是理想的选择,当前云数据中心有90%的存储容量仍然基于HDD的,这一事实就证明了这一点。
应用3:辅助存储或备份
一般来说,备份应用要读取更大的文件有效负载并将其写入存储。就存储系统的性能要求而言,这些工作负载几乎与随机IO、延迟敏感型工作负载是完全相反的。
当备份应用能够快速顺序访问巨大的备份数据文件时,备份应用的性能最佳,吞吐量为每秒千兆字节(或每小时兆兆字节)。此外,由于当前大多数企业组织都有数百个关键任务应用,因此资源必须同时并行处理多个备份和恢复任务。使用共享存储系统来防止传统存储孤岛的蔓延,从经济角度来说是有意义的。
对于这种类型的顺序IO工作负载来说,QLC闪存解决方案和基于HDD的解决方案,二者之间的区别可以忽略不计。基于HDD的对象存储解决方案能够实现数十GB/秒,吞吐量足以使网络饱和。这一点至关重要,因为这里的性能限制因素不是存储系统,而是网络。
此外,随着应用处理、重复数据删除/压缩和数据重组时间成为备份和恢复的关键时间考虑因素,应用本身可能成为整体解决方案性能的限制因素。因此,HDD和闪存SSD之间的吞吐量增量差异通常可以被认为是微不足道的,特别是在分析中考虑成本的时候。
小结:选择使用HDD还是SSD取决于性能与成本之间的平衡
优化千万亿级应用的性能,这可能取决于在为应用需求匹配恰当的存储时一个微妙但很重要的考虑因素。QLC闪存并不是一种万能的选择。对于延迟敏感型、读取密集型工作负载来说,较高的成本可以为最终用户带来有意义的好处。然而,这并不总是适合其他类型的工作负载,其中就包括了备份——现代数据和勒索软件安全策略的核心。
通过将性能模式与介质的优势和成本相匹配,数据中心团队就可以在性能和成本之间取得完美的平衡。
好文章,需要你的鼓励
人工智能领域正在通过改进模型工作方式来释放新功能。研究人员开发了一种名为"SVDquant"的4位量化系统,可以使扩散模型运行速度提高3倍,同时提升图像质量和兼容性。这种技术通过压缩参数和激活值来大幅降低内存和处理需求,为资源受限的系统带来新的可能性。
Meta公司开发了一种机器学习模型SEAMLESSM4T,能够实现36种语言之间的近即时语音翻译。该模型采用创新方法,利用互联网音频片段避免了繁琐的数据标注。这一突破性技术有望简化多语言交流,但仍需解决噪音环境、口音等挑战,并关注技术可能带来的偏见问题。
生物制药行业正积极拥抱人工智能技术,大型企业投入巨资,小型公司谨慎布局。行业面临人才、数据和工作流程等挑战,但预计到2025年将在AI就绪度方面取得实质性进展。AI有望加速药物研发,提高效率,最终造福患者,重塑医疗保健的未来。
随着 AI 需求激增,数据中心行业面临严峻挑战。能源消耗激增威胁可持续发展目标,新项目遭遇公众反对。电力供应和分配方式亟需改革,行业或将迎来动荡的 2025 年。