2015年12月,华为出了一份关于存储未来如何发展的白皮书,ROADS of Storage。字面意思是存储之路,算是对未来存储的发展做了一些更清晰的方向。ZD至顶网存储频道在这里就白皮书的一些内容和大家分享一下。
ROADS的核心是站在用户的需求来预测存储未来发展方向。白皮书也清晰的说“ROADS是用户体验”。
华为认为在信息时代的今天,未来相当长的时间用户对于IT的需求有一下特点;
实时(real time),按需定制(on demand),全在线(all on line),自助服务(DIY),社交分享(social),将这些词的第一个字母组合,就是ROADS。巧合的这个组合就是道路通路的意思。
ZD至顶网存储频道对此做了解读:
real time好理解,是时间和空间上的零距离。让用户实现零距离,随时应用。现在一个业务流程从需求到订单下发,付款,系统配置等需要几个小时甚至几天,今后要做的就是几秒实现一个完整的业务流程,业务发出就实现对用户实时生效。
按需定制,公有云、混合云爆发式增长,用户对于数据存储的需求呈现了多样性,按需定制满足了用户在带宽、容量、时间、质量等多个维度进行更加灵活自由的选择。
all on line,不仅仅是7X24小时全天候实现业务和存储服务,更多的意思是所有的服务未来都与云相关,线下线上实现融合。因为用户的应用在变化,老百姓以及习惯的在线购物、在线缴费、在线办公。随着政府对于公共数据的开发,相信基于云的服务会更快推广。
DIY,用户自助服务,提供一个平台,让用户提供一个机会,可以让用户参与各种业务的优化,安全。数据始终是自己的。
Social,社交就不用说了,为用户群体提供一个分享经验、使用心得的社交平台。
用户的需求在变,背后的IT架构肯定也会变化。
所以存储的发展需要满足ROADS进行推进。华为认为存储产业的变革之路会围绕融合、云、开源来展开。
资源池的融合,华为认为有两条路,第一条路就是通过内置异构虚拟化功能,接管不同厂商的存储设备,形成统一的资源池。实现资源统一、灵活分配。包括IBM SVC、华为 V3系列的smartvirtulization、Data ONTAP等
第二条路就是统一的管理软件,基于openstack接口将个厂商的存储资源统一管理的形成的逻辑资源池。包括华为OCEANSTOR DJ、飞康的freestor等。
存储架构的融合,高中低端存储互联互通,无需借助第三方软件,实现数据在不同产品中流动,包括HPE的3PAR以及华为的V3中低端系列以及18000高端存储。
存储介质的融合,这个大家很熟悉就是固态存储与传统存储的融合,让冷数据、热数据实现在合适的价格上实现最优的存储。
和所有的机构和存储厂商预测的一样,华为认为混合云会成为企业IT的未来。
华为认为企业走向混合云经历三个阶段
计算上云,用户可以自由连接到云上,同时保持对私有存储系统上的数据完全控制。
非生产数据上云,简单说就是将传统数据中的数据备份归档的冷数据放到公有云上。
生产数据上云,让传统企业的数据中心实现私有云和公有云的统一逻辑资源池,灵活弹性使用云。本地提供元数据管理和热点数据缓存,实现数据的有效利用。
开源平台软件目前火热的有openstack和docker。Openstack几乎被目前所有IT厂商认可。Docker的特点是敏捷、快、灵活、轻量等。
Ceph是统一分布式存储系统,在性能、可靠性、可扩展方面优势明显
GlusterFS是开源的分布式文件系统,特点有扩展性和高性能、高可用性、全局统一命名、弹性哈希算法、基于标准协议等优势。
Swift是openstack开源云计算的子项目,称为对象存储有很强的扩展、冗余和持久性。
海量数据冲击数据中心架构,需要对数据中心IT架构重新设计,包括Google、Facebook、BAT等推出的OCP和天蝎等项目。
ZD至顶网这里简单梳理了一下此次白皮书的一些重要观点和趋势,有兴趣的朋友可以去华为官网下载查看全文。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。