扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共2页)
Hadoop连接器座右铭:各得其所
Menninger表示:“目前用户将信息放到关系型数据库中,主要是因为用Hadoop数据源还不能轻松地制作报表。业界中有一套成熟的报表和分析系统,当然这都是针对关系型数据而言。”
这样的数据传输并不一定是一锤子买卖,也许你正在计算某一事件的发生次数,然后又想要计算两件事一起发生的次数。你可以返回到数据源,然后再处理一遍信息,这就是为什么人们不会把非结构化的数据删除,它们可以存放在Hadoop中。
此外,同SQL数据库相比,Hadoop为高级分析和数据挖掘应用提供了更好的环境。比如分析客服电话日志以及社交媒体上的信息,找出客户的兴趣点 以及对某一产品的口碑。这对于SQL来说是非常困难的一件事,但是它可以通过Hadoop连接器来把信息传输到关系型数据库或者数据仓库当中。
Tynt多媒体公司的副总裁Cameron Befus表示,他们使用了Hadoop来为超过50万的用户提供分析服务。此外,Tynt还使用了开源的MySQL数据库来作为后端的支持。到目前为 止,Befus还没有看到部署Hadoop连接器的必要,他说:“我们的确会把数据进行转移,但这通常是很直接的。我们会把文件从Hadoop直接导入 MySQL中,如果使用连接器的话也许会轻松一些,但是这对我们来说并不是什么难题。”
但IT分析师认为随着Hadoop的普及,这样的连接器软件使用频率将逐渐多起来。像Menninger这样的分析师认为,公司希望能够把基于 Hadoop的分析结果导入更大的业务环境中去,这也是连接器技术发展的推动力。当我们看大数据的时候什么最重要?那就是这些数据能够告诉我关键的问题是 什么。用户希望能够在非结构化数据、流数据、有意义的数据以及高度结构化的数据之间构建一座桥梁,以便能够通过分析来找到问题根源所在。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者