AI、5G、大数据的融合发展,不仅产生了海量的数据,也让人们更加深刻的认识到数据的价值。数据存储的重要性不断的提升对于存储系统的进化起到决定性作用。
这其中软件定义存储因为其具有的统一管理、高可扩展、高性能,灵活部署等特质成为存储领域的高增长点。
随着软件定义存储的成熟,各个厂商都在推出软件定义存储解决方案。近日至顶网采访了Bigtera高级解决方案架构师孟祥利,基于新数据时代的存储特征结合Bigtera产品的优势来阐述了他对于软件定义存储的理解。
Bigtera高级解决方案架构师孟祥利
新数据时代存储进化的三大特征
新数据时代对于存储需求呈现三大特征,存储规模、存储性能以及存储的共享和管理。
存储规模,云计算、大数据以及AI等技术蓬勃发展,需要PB甚至EB级的存储支撑。
存储性能,同时后端存储需要拥有百万甚至千万级的IOPS性能、GB级甚至TB的吞吐带宽,才能满足前端优质的服务体验。
同时随着数据的重要性越来越大,需要设备资源和数据资源需要在共享基础上的再利用,这些数据的共享和管理可能牵扯到几百个乃至更多的数据存储节点,涉及数万个数据卷或者数百万个文件,这需要借助统一架构来支撑、统一管理平台来调度和组织。
面对新数据时代,软件定义存储的优势
孟祥利分享了自己对于软件定义存储的优势看法。结合软件定义存储的优势Bigtera产品具备弹性分配、开放平台以及简化管理三个优势。
弹性分配,Bigtera可以纳管第三方设备,可以很快的而且可以按需得分配扩展这些传统的设备。
开放平台,我们现有的系统当中有非常多的API可以供三方,或者是软件进行对接。
简化管理,我们要将所有的管理进行简化,大规模的存储部署和管理要简化,才能够让更多的平台能够融入进来,并且能够运营起来,它的整体成本才能降低。
Bigtera的软件定义存储进阶之路
目前Bigtera产品覆盖了包括全闪存、分布式存储以及超融合三个领域:
全闪存阵列FlashGo,具有高效存储能力、数据安全性以及闪存功能等特性。
FlashGo为关键业务提供超高性能。具备百万的IOPS的能力,并且整体延时小于1毫秒。在数据安全性上采用独特的RAID6技术。
“大家都知道SATA盘使用RAID技术是非常普遍的,但是我们是使用了动态RAID方式,基于Nvme的磁盘上做了RAID这种方式,当然这种方式有很好的安全性,并且能保证性能的读写。当然闪存的一些特有的功能我们也是支持的,包括快照、克隆经典配置、QOS都是我们支持的,包括重删和压缩我们也都是支持的。” 孟祥利表示。
分布式存储Scaler,经过多年的迭代目前以及升级到8.0版本。Scaler具备融合存储能力、异构设备存储利旧以及云特性等优势。
融合存储能力,能够同时提供块、对象、文件系统三种方式使用,可以使用SATA、SSD、SAS等硬盘作为分层存储空间。基于scale-out架构 可以进行横向扩展,同时支持副本、纠删策略。
异构设备存储利旧,Scaler具有异构纳管的能力,我们可以使用多品牌的设备利旧,只要支持SAN既可进行设备利旧,专利技术保证以最短的时间实现云存储服务上线。利旧后的存储也集成了融合存储能力。
以及超融合ConvergerOne,ConvergerOne将虚拟化和存储进行融合,形成一整套产品,这样之前的Converger产品也就并到了ConvergerOne这套产品线里面来了,我们既可以出售我们的软件,也可以出售我们的一体机。
ConvergerOne具有六大特色:
一、支持文件系统,相对于传统的超融合的虚拟化能力,ConvergerOne既可以当做业务的存储,也可以当做虚拟机的存储。
二、使用主流平台,使用深度调优的KVM,实现统一管理以及和配置。
三、GPU支持,支持GPU类应用,我们可以通passthrough方式来支持GPU的模式。
四、最小应急系统,“我们可以将整体的ConvergerOne的产品包装成最小的应急系统,为现在很多大型的云平台做最小应急系统,最小应急系统最关键的就是说在业务上进行备份,如果大型平台出现任何故障,我们可以做临时紧急的一些上载下载的平台。” 孟祥利解释到。
五、细粒度的VDI能力,在VDI里支持细粒度的备份,可以结合主流备份软件支持数据库、操作系统备份和恢复。
六、微型系统,适用某些工作组级别的应用可以使用最小应用系统,比如跟很多转播车或者车载设备做联合过程当中,进行一些车载的微型化系统和小型系统的工作。
以广电行业为基础,服务更多行业
软件定义存储最早服务于广电行业,广电多媒体长期以来面临着视频直播、新闻信息等随需扩展、高吞吐量和高可用的存储资源池,基于Bigtera独特的秒传技术,从控制信息流和数据信息流分离的方式,实现了整个数据的快速共享。“随着4K和8K的产生,媒体文件变得更加大型化了,以前10个G的文件现在可能变成50G、60G,从这个领域上来讲我们一秒钟能处理一个T的数据,那这种方式对于它来共享来讲,更加快捷,而且效率很快的情况下不占用其他的空间。” 孟祥利谈到。
孟祥利认为软件定义存储解决方案的行业属性是很清晰,包括广电行业绝大部分的数据都是非结构化的数据,这些数据的管理过程当中有一些安全性和一些性能是会有非常大的区别的。Bigtera的思路是基于行业实施内部细分。比如说广电行业,既有传统上的非结构化的大文件。又有新媒体或者是一些音频的小文件。“所以从软件定义存储的方式上来看,我们认为基于一个行业的再细分,进行分别的存储策略,是软件定义存储的重要方式。” 孟祥利最后分享到。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。