扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共2页)
不过至少传统IT基础设施(包括服务器,存储和网络)是围绕结构化信息而构建,且适应于半结构化信息。但实际上它们并不能满足大数据所需的多层面结构、规模和分析的要求。
这就是EMC在大数据定义中强调新架构的原因所在,同时也是EMC收购Isilon和Greenplum的原因所在。关于这些收购已经有很多的报道,因此下面本文将简单阐述企业针对大数据不同的架构需求。
基于文件的存储,是大数据应用的基础,其发展速度远远高于基于块数据的发展。IDC预测,80%的存储容量将用于基于文件的数据。NAS(网络附加存储)经常用于基于文件的数据,但纵向扩展NAS存在着多层面的限制,包括可扩展性和性能。而横向扩展NAS存储架构可以克服这些限制。
举例来说,Isilon横向扩展NAS架构(使用其OneFS操作系统)可在单一文件系统中扩展至10 PB以上,并支持每秒50GB的吞吐量。然而,大数据应用可能会更注重某方面或其其他相关数据。因此,Isilon销售的S产品系列主要针对于高事务处理和IOPS密集的应用,比如基因组研究;而X系列解决方案主要针对容量密集型应用,诸如医疗图像这样的需要高并发处理和顺序吞吐的应用。
而Greenplum专注于应对大数据所带来的分析挑战。其产品套件支持分析密集型的大数据集,最终帮助终端用户从数据中挖掘突出价值。这通常需要复杂分析,比如特定的互动分析,而非简单的结构报告。分析速度尤其重要,特别是在需要频繁执行时以及数据分析结果有助于决策时。
不过,传统的关系数据库管理系统对于大数据分析并非最优化。因为它们的设计初衷是为了满足OLTP所需的随机读取和写入,而不是应对SQL需要的顺序读取。为满足这样的不同需求,Greenplum开发了大规模并行处理(MPP)系统,其关键要素在于性能和可扩展性。另外,Greenplum也提出必须构建新的架构才能满足大数据应用的需求。
大数据应用有多种方式,但其中都有一个共同点,即消耗大量的存储。大数据的科学和工程应用,如HPC(高性能计算),已经存在很长时间了,但大数据现在正发展为主流信息技术,包括娱乐媒体、医疗保健和网络的应用。
新的主流大数据IT新应用趋向于通过机械电子和机电设备来捕捉或创建数据,比如医疗设备、摄像机、RFID读取器和传感器,而不是使用人类的触摸或语音来产生数据。一般情况下,人类创建的信息都为结构化或半结构化信息,而通过电子设备创建的数据相比起来,更加非结构化。
无论是何种结构,要想利用大量数据得到见解以作为决策基础,都需要新的且更高水平的分析工具。此外,大数据对性能的需求(要求处理数据快)以及对容量的需求(要求有效支持的数据量大),与传统信息技术所能提供的不尽相同。大数据这些不同的需求也需要采用新架构才能满足。
EMC及许多其他厂商都将大数据应用视为一个很有发展前景的市场。因此,EMC同时收购Isilon和Greenplum的举动也不足为奇,EMC需要这个两个公司的帮助,以迎接大数据所带来的机遇。虽然没有哪家公司可以在多次收购之后,仍然保持一个完美的业绩记录,但EMC已经屡次证明它是一个收购“好手”。这其中原因之一在于EMC将被收购公司的员工也作为其收购的一部分,EMC不仅倾听这些员工的声音,鼓励他们发展,还会向被收购公司增加自有的专业技术、财政资源以及完善的分销渠道,从而积极加强被收购公司的实力。
Isilon和Greenplum曾是备受尊敬的独立公司,庞大的客户群让他们的技术实力有目共睹。大数据客户应该可以预见,EMC将继续向其获取的基础技术增加特性和功能,而这些公司的客户也需要认真考察EMC推出的解决方案。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者