科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道戳破大数据泡沫

戳破大数据泡沫

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

我们正处于一场关于大数据和分布式计算的炒作中,该是让大数据泡沫破裂的时候了。穿过一个炒作周期来使技术跨越鸿沟,从早期的采用者到更广泛的大众群体。而且,至少它暗示了一个超越学术对话和试点项目的技术进步。但是更广泛的观众采用此项技术可能只是随波逐流,一直就缺少一些重要的警示观点。

来源:ZDNet存储频道 2012年10月9日

关键字: 大数据 Hadoop

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共2页)

我们正处于一场关于大数据和分布式计算的炒作中,该是让大数据泡沫破裂的时候了。

是的,穿过一个炒作周期来使技术跨越鸿沟,从早期的采用者到更广泛的大众群体。而且,至少它暗示了一个超越学术对话和试点项目的技术进步。但是更广泛的观众采用此项技术可能只是随波逐流,一直就缺少一些重要的警示观点。

跟随潮流

在一个炒作周期内,通常有一个跟随潮流的供应商群,他们仓促实施一个时髦的技术,试图要保持与其相关而且不会在混乱中迷失方向。但是这些公司的产品可能会使市场混淆,因为最终这些技术会被不恰当地使用。

使用这些产品的项目将面临失败的风险 ,即使客户已经付出了大量的资源和精力,也有可能产出几乎没有投资回报率,然后客户可能会开始质疑被热炒的技术。现在Hadoop堆栈正在面临这种局面。

打破大数据泡沫以鉴别有关其产品和模式的某些细微的差别开始。以下是一些重要因素,分为三个重点领域,这些应该在你考虑一个hadoop分布式基础架构的相关技术之前弄明白。

Hadoop不是RDBBMS的杀手

Hadoop分布式系统在商品硬件和存储上运行,使它比传统的关系数据库管理系统(RDBMS)便宜很多,但它并不是一个数据库替代品。Hadoop分布式架构的建立是为了利用对较大数据块的顺序数据访问(一次写入多次读取)而不是单独的记录中。正因为如此,Hadoop分布式系统针对分析工作负载进行了优化,而不是关系型数据库管理系统的交易处理工作。

坦白的说,低延迟的读和写不在Hadoop的分布式文件系统(HDFS)中并不奏效。仅仅是协调的写入和读取单个字节的数据,就要求多个终端控制协议/网端协议连接到Hadoop的分布式系统,这给交易操作带来了非常高的延迟。

然而,在一个优化好的Hadoop集群中,读取和写入大块数据的吞吐量是非常高的。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章