大家可以想象下,今天的数据管理呈现出怎样的态势?
从数据量来看,人工智能、物联网、机器学习等技术的成熟和应用,数据量从GB到TB到PB再升至EB;从数据类型来看,交易数据、视频、音频、文档、邮件及移动数据等,从存储形式来看,从最初的磁盘到全闪存再到云存储、云服务……
不得不说,如今数据管理的复杂程度不仅仅局限于存储,而数据的保护、备份、恢复或许才是企业数据管理的重中之重。另外,也正是由于暴增的数据量使越来越多的企业认识到次级数据的价值。
提到次级数据,我们先来普及一下概念。一般而言,副本数据、备份数据和灾难恢复数据通常被认为是次级数据,生产数据和原始数据通常被划分一级数据。随着技术的不断革新,次级数据的价值日益凸显,并且应用也越来越广泛。
在Commvault大中华区技术总监蔡报永看来,当下大数据、数据分析技术的成熟逐渐使次级数据的利用领域快速拓展,过去传统形式只是为了将次级数据恢复后作为容灾生产用,现在很多时候都提供给企业作为开发测试使用,通过数据分析技术来挖掘数据的价值并提供全新的生产力,是Commvault一直在追求的理念。
Commvault大中华区技术总监蔡报永
由于许多关键领域发现次级数据的价值,次级数据在企业内部的地位也得到了提升,基于目前企业对于次级数据的强劲需求,Commvault在2017年下半年推出了HyperScale技术。据蔡报永介绍,传统的次级数据通常存放至磁带或磁盘上,Commvault采用业界流行的分布式存储技术利用现有的统一管理平台为企业快速构建一套HyperScale存储池作为次级存储,把次级数据经去重压缩处理后直接存放至HyperScale存储,需要长期保存的数据再转存到磁带或云。其主要优势在于客户备份的时候写入速度很快,并提供了强大的横向扩展能力满足企业级客户数据存储需求,而更重要的作用是将来会把开放的API接口提供给前端分析软件或搜索软件来使用时,它完全类似于一个一级存储同样的访问性能,也就是对二级存储的访问类似于一级存储,可以帮助企业向二级存储的方向进行改变,从而驱动关键业务和IT转型。
显然,将次级数据盘活是大数据时代下各大备份厂商的另一个突破口,也是前端应用企业及客户的需求点之一。在数据采集、分析、价值利用的过程中,Commvault更注重数据的采集,更多的是作为一个基础平台提供开放接口给分析软件以便于更透明的访问数据。
不过市场需求旺盛,竞争自然激烈。蔡报永表示,Commvault一直把自己定位为新一代数据管理平台,一体化数据管理平台架构的设计自1999年一直延续至今。正是考虑到平台的定位将来要满足几十年、甚至上百年企业管理数据的使用,所以必须是开放式的,且数据的可伸缩性做到很大。
除此之外,相比于其它厂商,Commvault无论是虚拟化、物理环境、传统的物理机、跟云的结合,包括次级数据的引入,即插即用的模式以及后端的存储直接在前端使用都可以支持,是一个完整的解决方案。
在应用领域层面,蔡报永认为如果企业重点依赖于IT资产的,一定是Commvault的重点拓展对象。在中国主打的行业是金融、电信、制造、零售等几大领域。为了让记者朋友深入了解Commvault的技术与方案,蔡报永举了一个关于零售的跨国型企业例子,进一步阐述了异地数据中心备份的数据可以快速传输到目的地。在制造领域,不少知名汽车品牌的整体业务发展在不同城市数据中心之间做数据的容灾都是采用Commvault的平台去做整个数据管理的保护。
在产品和技术研发层面,据蔡报永介绍,Commvault在2018年会主攻两个方向,一是会有更大投入去开发较多的开放式接口,并且会考虑把数据如何快速提供给测试或开发来使用;二是调整销售策略,积极扩展与众多合作伙伴的合作关系,为更多的企业提供最佳的数据保护解决方案。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。