扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共4页)
不同轨迹 太多交集
基辛格对于大数据理念的诠释是:来自多种数据源、规模达到10TB左右的大型数据集,并且解释说,大数据据并不局限于如今占所有数据比例90%的非结构化数据,它还涵盖半结构化数据和完全结构化数据,能够把这三种数据很好地融合起来,同时具有实时可迭代的特点。
在现实世界中,各个行业都可见大数据的身影,医疗信息、视频监控、移动设备、智能设备、非传统IT设备、传统IT信息的非传统应用以及特定行业需求等。当我们进入EB时代,数据无所不在,其中有90%都属于非结构数据,比如文件、照片、视频、电子邮件或社交网络通信,而且存在多种数据源,这让IT企业机构陷入了保存、管理和利用数据价值的困境中。
过去8年中,EMC在自主研发上的开支是105亿美元,在合并收购上的开支是140亿美元——其中大部分用于通过收购VMware、RSA、Data Domain、Greenplum和Isilon加强云战略
虽然大数据是EMC最近一年才大肆宣传的,但从过去几年中的收购路线可以看到,EMC其实早已开始布下棋局,通过Greenplum、Isilon和Atmos等不断完善每块拼图,可见EMC在大数据上的确是下足了赌注。基辛格认为,现在大数据还处于初期阶段,后续将有更多厂商提出大数据相关策略。
基辛格表示,在数据激增的云时代,云与大数据这两个有着完全不同定义的技术相互碰撞找到了交集。目前包括谷歌、雅虎和亚马逊等主要的云提供商都拥有大量大数据,打造云设施的时候,有些应用不必运行在云上,而大数据必须运行在云上,这就是云与大数据的关系——大数据离不开云。
他还补充说,支撑大数据以及云计算的底层原则是一样的,即规模化、自动化、资源配置、自愈性,这些都是底层的技术原则,因此他认为大数据和云之间存在很多“合力”的地方。
当然,大数据这一理念必须得到存储的支撑,企业存储模式也要相应地从纵向扩展、手动操作转化为横向扩展的自动化方式,孤立的存储系统整合成为容量超过10PB的统一存储池。同时,大数据应用需要大数据的分析,这同样要求以往的业务分析模式有所转变,从以前有局限性、预定义的模式逐渐转换为广泛的可反复执行的模式。
EMC描绘出这样的愿景:利用VMware虚拟化服务器基础设施、具有高弹性的阵列和云集群存储系统、半结构和非结构数据分析工具,从大数据中挖掘出有价值的信息。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者