科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道MapR加入EMC大数据 拥抱新的Hadoop分布式平台

MapR加入EMC大数据 拥抱新的Hadoop分布式平台

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

MapR科技与数据存储和安全巨头EMC在5月25日披露了一个新的软件授权协议,并在EMC的新Apache Hadoop分布式系统中加入它的知识产权。它实现了对Apache Hadoop软件堆栈的100%的界面兼容。新的装置将为预集成和测试分布系统使用MapR技术的集群IP。

作者:存储时代(编译) 来源:Stor-age.com 2011年5月27日

关键字: EMC 大数据 Hadoop

  • 评论
  • 分享微博
  • 分享邮件

MapR科技与数据存储和安全巨头EMC在5月25日披露了一个新的软件授权协议,并在EMC的新Apache Hadoop分布式系统中加入它的知识产权。

座落于加州圣何塞市的MapR将会成为EMC Greenplum HD企业版的一个重要组成部分,它实现了对Apache Hadoop软件堆栈的100%的界面兼容。新的装置将为预集成和测试分布系统使用MapR技术的集群IP。

由以前的苹果公司、Xerox PARC和雅虎资深开发者Doug Cutting创建的Apache Hadoop,是一个建立在Java上的开源软件架构并使用分布式加强数据应用来工作。它使得应用能够安全的扩展以便可以处理无数的节点和PB级数据。

尽管一些Hadoop分布式系统是可用的,但它们无法处理所有的单点故障问题,缺乏快照功能、缺乏镜像功能以及性能低下,这些都是为何要将MapR推上台面的原因。

MapR的功能概述

MapRCEO John Schroeder对eWEEK透露了一些关于MapR的功能,其中包括:

对网络文件系统(NFS)的直接浏览,允许用户使用NFS协议来简化加载以及直接在Hadoop集群中浏览数据,允许标准工具和实用程序直接运行在包含于Hadoop中的数据上。

Heatmap用户界面提供全部的集群可视性与控制。

所有的单点故障不会出现在Hadoop 堆栈中。

JobTracker HA(高可用性)能够确保连续执行作业。

带有高可用的分布式的NameNode(命名节点) 解决主要的可靠性问题的同时,也提高了性能和扩展性。

快照允许对时间点数据的保护和恢复。

维持企业工作连续性的镜像包含大范围的复制支持。

Evaluator Group 的高级分析师John Webster指出“这对每位Hadoop用户来说是一个重要的进步。MapR的创新与EMC的大数据分析能力和服务相结合,将会允许更多的人来使用大数据分析的能力。使得出现实质性的市场增长。”

“MapR已设法在性能、降低成本、可靠性和易用性上得到改进,这标志着Hadoop的市场将发生重大的改变。”

Hadoop受到Google's MapReduce的启发

目前在Cloudera担任Apache 软件基金会的主席Cutting曾表示:Hadoop受到过Google's MapReduce和Google文件系统的启发,MapR使开源软件MapReduce实现了商业化。

以Cutting儿子的大象玩具来命名的Hadoop,不断的被全世界各地的参与者所维护和改良,其中作为Hadoop的初始推动者之一并正在赞助一个Hadoop开发者会议的雅虎公司,已拥有为此项目服务的大量参与者并广泛的使用Hadoop来应用于自己的业务当中。

Webster指出:“在从传统数据仓库转换到大数据分析的过程中,Hadoop起到了主导的作用,EMC的Hadoop商业化战略旨在为企业级用户精简并强化Hadoop,使得Hadoop更多程度上成为企业必须具备的实时分析工具。”

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章