"坦白讲,我更多是进行技术层面系统架构的研究,并不擅长于前台宣讲。"李可提到,"在目前云计算、大数据平台的爆发阶段,有很多企业专门做数据备份、数据容灾或数据挖掘/分析及数据仓库的某一环节,但相对较为分散,而Commvault更注重于数据的全生命周期管理。"李可作为Commvault亚太区企业解决方案架构师,在媒体沟通会上,直入主题,介绍了Commvault的定位。
显然,李可是一位技术管理层,他认为,Commvault在魔力象限中处于领导者,主要原因在于远见和专注。

大数据时代 Commvault扮演怎样的角色?
根据IDC报告,2019年全球大数据分析市场的营收有望达到1870亿美元。同时,研究还显示,企业利用数据驱动型洞见做出的商业战略决策,可将生产力提升33%。显而易见,数据对于当今企业而言的重要性。
随着现代业务的快速发展,当前无论是IaaS、PaaS还是SaaS层, 方案堆积现象频现,无法将企业的真实情况反映出来,企业需要对所拥有数据做出完整梳理并掌控,因此Commvault提出的理念即数据管理,并不只是简单的数据获取、分析,而是将不同时期、不同来源、各个类型的应用数据汇聚一起,高效的存储并进行分析,提取商业价值。在这个过程中,Commvault扮演着类似于"心脏"的重要角色。
众所周知,数据分析的过程并非易事,Commvault的内部数据分析引擎,将整理后的数据提供至相关行业做深入挖掘。"在这个过程中,Commvault可以被理解为收集者、搬运工、分析者,同时兼具搜索和分析,最重要的是数据的展现者。"李可解释到。
事实上,所有的数据都有两种形式持久化,一是在传输过程中数据流,当数据通过应用发生流动时,Commvault可通过某种方式获取实时传输数据源;二是无论是Hadoop的应用写入、虚拟机、文件系统日志存储路径或基础架构层,只要数据有写入或流动,必定会触发规则,成为持久化的一个环节。
重点行业 重点布局
对于每个行业的需求,李可表示:"目前在医疗、金融、交通、电信等领域,数据需求较为迫切,因为行业属性会产生大量零散的非结构化数据,需要IT厂商制订一套较为完善的方案做数据源整合与管理。"
李可重点提到了医疗行业,Commvault为医疗企业的数据库管理系统做了深度集成,在后端做统一整理清洗,并提供多元的异构数据平台,以方便调取挖掘。其实,在医疗、金融领域,Commvault已经有专门的合作伙伴一起将业务知识、数据管理能力结合在一起去开发相应解决方案。
由此看来,Commvault数据管理解决方案惠及至各行各业,同时也突显了大数据分析市场的强劲需求。而提到数据管理,安全性也是不得不提的话题。不少数据分析供应商在源数据安全上同样煞费苦心。相比于其它厂商,Commvault最大的优势在于完整的数据管理体系。在数据保护、备份、搜寻、恢复上,形式一条闭环链,且可以根据需求灵活性定制,可在Commvault专家的帮助下,既实现安全法所规定的要求,也可以通过自动化的数据处理来减轻操作的压力。
暗数据如何点亮?
众所周知,在数据科学领域,许多企业仅利用了数据的一小部分,有些宝贵数据被遗放在数据孤岛中,无法得到有效利用。行业研究显示,全球每天创造2.5个五万亿字节的数据,而在过去的两年中,这些数据中的90%来自于每天从众多不同渠道产生的数据。换句话说,这相当于575亿台32 GB内存的iPhone手机总存储量。毫无疑问,这确实是海量数据,但是其中大部分数据处于黑暗状态。
对此,李可认为,企业对于暗数据最大的期望在于减少存储成本。Commvault对于暗数据的存储,不需要借助第三方软件或平台,可基于Hadoop等大数据平台做集合,充分利用Commvault数据存储去重压缩的能力,来降低暗数据的存储成本。
"用户需要做数据分析或查询时,通过Commvault统一索引体系和管理界面就可以对跨中心,分层存储的各类数据进行统一检索,无需更复杂的操作。"李可表示。
小结
信息技术的高速发展,使数据量和数据源日益增长,与此同时,数据管理业务也变和尤为复杂。IT管理人员需要及时筛选数据,从而有效管理、保护和利用数据,以释放出更大商业价值。Commvault解决方案在业界确实有较高知名度,不过目前市场竞争激烈,能否长居领导者地位,还有待观察。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。