科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道大数据:价值在于分析 风险如何规避?

大数据:价值在于分析 风险如何规避?

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

大数据时代的来临已经毋庸置疑。如何有效地利用这些数据,通过分析获取其中的价值,这是摆在我们面前的一个难题,也是近日在北京举行的大数据世界论坛上众多与会者关注的焦点话题。

作者:刘杰 来源:ZDNet China【原创】 2011年7月13日

关键字: EMC 大数据 数据分析 Greenplum

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共3页)

如何通过分析获取价值?

陶波认为,大数据分析需要具备四个条件:首先是数据科学家,这将成为未来最热门的行业之一;创新,需要不断提出关键性以及具有启示性的问题;由大数据分析师们组成的社区,协同地对数据进行分析,共享分析结果;大数据产品堆栈,为大数据分析提供基础支撑。

大数据:价值在于分析 风险如何规避?

技术聚合使得大数据分析得以实现,虚拟化已经成为云计算的代表,x86的计算性能不断提高。大量数据被存储和处理,云计算成为大数据分析得以成为现实的重要支撑

早些时候,EMC收购了小型软件生产商Greenplum,获得了后者可以用于横向扩展和加速数据仓库以及业务分析应用的软件,EMC将其打造成为一个业务分析引擎,用于处理来自在线以及传统数据库来源的大型数据集,围绕Greenplum创建了EMC Hadoop和Greenplum数据库等产品,与Oracle以及Teradata已有的加速业务分析平台相竞争。

解析大数据对于新型业务分析应用存储所带来的影响,首先要区分传统数据仓库多个流程,例如,标准的提取、转换以及加载流程对于传统数据仓库应用来说很常见,但达不到足够的可扩展性和高速度。一款整合了服务器、存储和网络的专用设备给出了答案——Greenplum HD数据计算一体机无缝集成了结构化与非结构化数据,是Greenplum Database与Apache Hadoop的强强联合,而Hadoop则是应对非结构化数据实时处理的一个关键手段,它使得互联网企业专门为自己业务设计的一些程序和管理软件、计算和分析方式渗透到企业中。

Greenplum Chorus是EMC的一款企业数据云平台,堆栈了各种大数据分析工具(业务分析、BI、统计等)。陶波表示,Greenplum Chorus可以做到自助式的调配、数据服务协作分析。用户同时部署Chorus、VMware和Greenplum数据库来创建一个自助式的分析基础架构,自助服务可以生成一个服务器或者一个沙箱,而这个沙箱既可以基于虚拟化的IT云计算平台上,也可以是在Greenplum的数据库之上的。同时,用户可以把在企业云里面其他的原数据导入到自己的沙箱中进行操作,开发者可以创造一个合作环境,在分享数据的同时控制授权,避免私人数据被不适当的使用。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章