大家可以想象下,今天的数据管理呈现出怎样的态势?
从数据量来看,人工智能、物联网、机器学习等技术的成熟和应用,数据量从GB到TB到PB再升至EB;从数据类型来看,交易数据、视频、音频、文档、邮件及移动数据等,从存储形式来看,从最初的磁盘到全闪存再到云存储、云服务……
不得不说,如今数据管理的复杂程度不仅仅局限于存储,而数据的保护、备份、恢复或许才是企业数据管理的重中之重。另外,也正是由于暴增的数据量使越来越多的企业认识到次级数据的价值。
提到次级数据,我们先来普及一下概念。一般而言,副本数据、备份数据和灾难恢复数据通常被认为是次级数据,生产数据和原始数据通常被划分一级数据。随着技术的不断革新,次级数据的价值日益凸显,并且应用也越来越广泛。
在Commvault大中华区技术总监蔡报永看来,当下大数据、数据分析技术的成熟逐渐使次级数据的利用领域快速拓展,过去传统形式只是为了将次级数据恢复后作为容灾生产用,现在很多时候都提供给企业作为开发测试使用,通过数据分析技术来挖掘数据的价值并提供全新的生产力,是Commvault一直在追求的理念。
Commvault大中华区技术总监蔡报永
由于许多关键领域发现次级数据的价值,次级数据在企业内部的地位也得到了提升,基于目前企业对于次级数据的强劲需求,Commvault在2017年下半年推出了HyperScale技术。据蔡报永介绍,传统的次级数据通常存放至磁带或磁盘上,Commvault采用业界流行的分布式存储技术利用现有的统一管理平台为企业快速构建一套HyperScale存储池作为次级存储,把次级数据经去重压缩处理后直接存放至HyperScale存储,需要长期保存的数据再转存到磁带或云。其主要优势在于客户备份的时候写入速度很快,并提供了强大的横向扩展能力满足企业级客户数据存储需求,而更重要的作用是将来会把开放的API接口提供给前端分析软件或搜索软件来使用时,它完全类似于一个一级存储同样的访问性能,也就是对二级存储的访问类似于一级存储,可以帮助企业向二级存储的方向进行改变,从而驱动关键业务和IT转型。
显然,将次级数据盘活是大数据时代下各大备份厂商的另一个突破口,也是前端应用企业及客户的需求点之一。在数据采集、分析、价值利用的过程中,Commvault更注重数据的采集,更多的是作为一个基础平台提供开放接口给分析软件以便于更透明的访问数据。
不过市场需求旺盛,竞争自然激烈。蔡报永表示,Commvault一直把自己定位为新一代数据管理平台,一体化数据管理平台架构的设计自1999年一直延续至今。正是考虑到平台的定位将来要满足几十年、甚至上百年企业管理数据的使用,所以必须是开放式的,且数据的可伸缩性做到很大。
除此之外,相比于其它厂商,Commvault无论是虚拟化、物理环境、传统的物理机、跟云的结合,包括次级数据的引入,即插即用的模式以及后端的存储直接在前端使用都可以支持,是一个完整的解决方案。
在应用领域层面,蔡报永认为如果企业重点依赖于IT资产的,一定是Commvault的重点拓展对象。在中国主打的行业是金融、电信、制造、零售等几大领域。为了让记者朋友深入了解Commvault的技术与方案,蔡报永举了一个关于零售的跨国型企业例子,进一步阐述了异地数据中心备份的数据可以快速传输到目的地。在制造领域,不少知名汽车品牌的整体业务发展在不同城市数据中心之间做数据的容灾都是采用Commvault的平台去做整个数据管理的保护。
在产品和技术研发层面,据蔡报永介绍,Commvault在2018年会主攻两个方向,一是会有更大投入去开发较多的开放式接口,并且会考虑把数据如何快速提供给测试或开发来使用;二是调整销售策略,积极扩展与众多合作伙伴的合作关系,为更多的企业提供最佳的数据保护解决方案。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。