全闪存阵列方兴未艾,混合阵列已成长为最具竞争力的产品形态。
根据最新数据,全球混合闪存市场规模预计为83亿美元,而全闪存阵列市场规模为8亿美元,前者是后者的10倍之多,越来越多的存储用户倾向于使用混合型闪存存储阵列,这一差距在未来仍将持续扩大。
前不久,戴尔存储大中华区总经理李海平在接受采访时称,戴尔正在以全闪存阵列为战略目标,全面支持混合闪存阵列,让客户逐步接受这两种产品形态。
李海平认为,现在市场中的闪存阵列主要分三种:纯闪存阵列,全部且只能使用闪存存储,无法兼容过去,是革命性的;全闪存阵列,可以全部配置使用固态盘,也可以配置其他的传统硬盘,是渐进式的;混合阵列,固态盘和普通硬盘混合配置。
按照这个定义,现在很多闪存初创公司的阵列都是纯闪存阵列,他认为,之所以无法切换为混合阵列是因为无法做数据的有效“漂移”,无法在全闪存和混合闪存之间做到无缝连接。当需要更大容量的时候,只能增加SSD来增加容量保证性能。
“纯闪存公司做大量的算法实现重复数据删除和压缩,这会折损性能,戴尔的做法是把闪存内容沉淀到容量更高的介质中。”
从另一个角度看,服务器端的闪存容量有限,性价比较低,不同服务器之间无法进行数据共享,没有统一的软件保证数据一致性,这是服务器闪存的问题。而在存储端,SSD不同厂商有不同问题,老牌厂商通过并购获得闪存技术,孤立的硬件体系,而戴尔是在同一套体系内做闪存调度,用软件的方式消除了信息孤岛。
现在戴尔正在做的是,把Tier 0级闪存放在服务器,Tier 1级闪存放在存储,通过软件实现所有服务器闪存之间的数据同步,同时快速同步到存储闪存,再分层到普通硬盘中,三者打通,由此产生了500万IOPS的架构,相当于淘宝双十一的整个交易量。
网秦就是这样一家从无到有采用全闪存阵列的企业。早在2011年网秦就已经遭遇性能瓶颈,所有数据先经过一层缓存,再经过多层多级缓存,最后加载不了的数据会被放入数据库进行读取,最后不得不购闪存阵列来彻底解决他们的难题。
现在网秦采用了戴尔Compellent全闪存解决方案以及SharePlex,整个基础架构没有做太多改变,运维团队在2014年完成平滑升级,单次业务处理时间提升了100%,不到80毫秒,实时数据同步得到了很好的保障。
目前网秦配置了12块SSD,其中6块用于处理快速读,6块处理密集写,同时软件实现损耗均衡,这样可以很好地处理订单高峰期和大规模统计查询等场景,又兼顾到延长SSD的使用寿命。
据了解,网秦在全球有7万个纯业务级监控点,全部放在Compellent闪存阵列上运行。原来网秦是每一个季度迁移一次数据,不能做大量的历史数据对比,到现在一年多时间都不需要迁移数据,读写速度表现依然良好。
谈到对闪存阵列的接受,网秦的IT运维经理称,他们也是经过一段“心路历程”的。一开始他们对于如此“奢侈”的方案有些难以接受,但是看到I/O性能表现之后就特别欣慰了,相比较下来,这样的性价比是比较能够接受且合理的,现在对闪存依然较高的成本已经从心理上落位了。
除了网秦之外,李海平介绍说,魅族和比亚迪等客户也采用了戴尔的Compellent全闪存解决方案,用于商品交易平台和核心交易平台的应用,体验到了显著的性能提升。
用户的需求,也是促使戴尔加快布局闪存市场的动力来源。去年,戴尔推出一款定价只有2.5万美元的入门级全闪存阵列,今年,再增加一款配置稍高的SC4020定价为3.5万美元,采用6个200GB写密集型SLC固态盘以及6个读密集型MLC固态盘,原始容量4TB。
除了全闪存配置之外,SC4020阵列的槽位还可以接入普通硬盘构成混合阵列,来自ESG的报告将SC4020的总拥有成本与其他系统进行了对比。虽然没有说明使用的是哪两款竞争系统,但它称“戴尔8年期内的总拥有成本要显著低于竞争对手”。
可以预见的是,戴尔将向全闪存阵列中增加重复数据删除功能,这会进一步有效地降低每GB成本。不仅如此,戴尔从低端到中高端将全面布局闪存,这些举措将帮助戴尔迎接其他闪存阵列厂商的挑战,同时更好地开拓中小企业闪存阵列市场。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。