社交平台洞察力!IBM大数据玩转世界杯

对于这次世界杯的报道,腾讯网与以往不同,他们与IBM合作,由IBM提供数据分析的支持,来帮助腾讯在世界杯期间推出更有独特性、有数据支撑的报道,包括了赛前的各队支持率,赛后对整场赛事的点评分析等。总之这是一次IBM将大数据与舆情分析相结合的市场活动。

对于这次世界杯的报道,腾讯网与以往不同,他们与IBM合作,由IBM提供数据分析的支持,来帮助腾讯在世界杯期间推出更有独特性的,有数据支撑的报道,包括了赛前的各队支持率,赛后对整场赛事的点评分析等等。总之这是一次IBM将大数据与舆情分析相结合的市场活动。

以下是访谈文字整理:

主持人:各位网友大家好,欢迎收看ZDNet视频访谈节目。可以看到今天我们演播室也非常热闹,这边是我们ZDNet副总编赵效民,我们请来的嘉宾是IBM研究院苏中博士,今天我们要谈的话题也是特别热闹。

我们最近看到很多包括这样和世界杯和大数据产生互动这么一些消息,包括刚才苏中博士也谈到了今年IBM有一些动作,我想问一下苏东博士您觉得最近为什么大数据和世界杯产生了这么多的互动,这么多的关联?

嘉宾:对,实际上大数据在改变我们每天的生活,我们每天都在上微信,微博,很大程度上是说大数据本身是因为我们的这些像社交、移动的这种变化,给这种传统的媒体带来很大的变化,就是我们以往很多时候是单向的传播信息,比如说电视台在播放足球比赛的信息我们就听,第二天看看报纸,但现在对于广大球迷来说我们大家自己也可以在网上用手机去发表自己的看法,所以每个人都像一个记者把自己的心声讲出来,这一点是很有意思的,就是因为这样的一个变化,人与人之间也发生了一些连接。

我们是觉得比如说我们在这次跟腾讯的合作里,腾讯的编辑们特别希望他们能够换一个角度,从球迷的角度,从赛场以外的角度来去看到底中国球迷对于这场比赛的看法是什么。我们想是大数据,很多数据是人产生的,IBM讲的是大数据几个维度,其中一个很重要的维度是人为产生的数据分析能够真的带来一些洞察,我们是希望利用这样的一种方法来去真的让世界杯,让人,让技术,让媒体之间产生很好的互动。

主持人:刚才苏中博士介绍这次IBM和腾讯的合作,从一个媒体角度来说它其实是一种基于社交平台的舆情的数据分析,可能本质是收集人们在社交平台上留下的一些信息,来判断人们对现在走势的一些潜在的意向,以及舆情的状态。想问一下苏中博士像这种从社交平台抓取和处理数据,和我们以往的一些数据分析有哪些不同之处,它的特点和难点在哪?

嘉宾:社交媒体本身带来很大挑战是说因为社交媒体上不像我们的新闻联播或者是像我们的这种电视台,这种新闻媒体发来的这些材料,内容质量都非常好。我们在社交媒体上看到各种各样的数据,很多的数据错别字,各种各样的一些表情符号,很多发明一些新词,这些东西带来的挑战从技术角度来说,对于如何去理解语言本身,理解语义带来更大的挑战。

主持人:所以想了解一下在这次合作中IBM它扮演的一个角色是什么,提供了哪些技术平台以及工具,就解决刚才您说的针对这些数据进行分析的一些难题?

嘉宾:是的,我们IBM研究部门一直在做这方面的,尤其是非结构化信息分析的这一块的工作。我们在这样的一个技术平台上,我们构建了一个系统。它这个系统最大的特点是我们里面用到了很多基于机器学习的方法一些自然语言分析的技术。

我举个例子,比如说我们里面用到了一些技术,比如说我们叫做深度的情感挖掘,它就是说我们传统讲的比如说情感挖掘,判断这一篇文章对于某个主题,比如说对IBM产品是喜欢还是不喜欢,这是一个很有意思的技术点,过去很多年我们做了很多技术,我们讲的深度情感挖掘是不光我们知道他喜不喜欢,而且还知道他为什么喜欢,这一点实际上是很大的不同。

另外,我们有云计算的平台,我们整个系统是部署在我们IBM新的云计算的环境叫做SoftLayer,这一点也很不一样,因为大数据往往和云计算自然而然连在一起,很多时候因为数据大,所以我们对计算的弹性有很大的需求,比如说数据量突然爆发你可能需要更多的服务器,有一个突发事件发生你可能需要更多的计算资源或者存储设备。我们这次也把我们的这个平台部署在SoftLayer这个云计算环境里头,我们会实时把我们的分析结果推到腾讯的世界杯网站上。另外,我们自己的系统也分享给腾讯的报道人员,他们利用我们的系统来写出一些很不一样的报道,因为那里面的数据是球迷的心声,它从另外一个角度,从球迷的角度来看足球比赛是怎样的分析一个进程,这也是在这届合作里面很大不一样的地方。

主持人:所以看到在这次世界杯的报道中,IBM使出的一个招数是用Blue Pulse加SoftLayer云计算,我觉得从我这个角度来看这里头有一个很大的特色就是把大数据和云计算结合起来了,以往我们听到大数据可能更多强调软件方面的数据处理分析,现在结合了这个云计算之后你觉得和平时传统的这种解决方案有什么不同?云计算在这个大数据分析里头扮演了一个什么重要的角色?

嘉宾:从这个数据量的角度来说,大数据我们需要一个非常弹性的计算平台,这一点很重要,云计算本身带来了这样一个不一样的解决方案,和我们用传统的解决方案来比。

第二,我们还看到从系统的管理角度来讲,这次我们研究部门和我们的服务团队也第一次尝试了一下,因为这是IBM第一次B2C,就是面向我们叫做广大球迷提供一些分析的报告服务等等,从这个角度来讲我们需要有一个7×24小时这样的服务,对于我们来讲这个数据和系统部署在一个云计算环境下很大的一个点是说它很方便我们管理,我们在家看球也可以,如果系统出了任何的问题,或者是说计算资源不够,很方便就能够把新的节点启动起来,这种按需分配的资源,包括很快地响应,比如说某个系统有故障,很快,大概一两分钟以内另外一个备份系统就可以启动起来,这也是云计算带来一个很大的不同。

所以这次我们自己的一个体会是说有了云计算实际才能让这种大数据分析带来一个很好的基础,IBM我们自己来讲,我们很多时候讲我们现在的分析,我们现在新的产品叫Watson,,很多也是跟云计算,跟大数据绑在一起的。所以我相信在未来云计算会变成一个主流的计算平台,会不断地给大数据分析带来更好的一些计算上或者是服务上的体验。

主持人:我们刚才看到二位一个是球迷,一个是大数据迷,聊起来不知不觉已经聊了一个上半场时间的这么一个话题。我们相信其实不管是大数据也好,延展的话题说起来很多。

来源:ZDNet存储频道

0赞

好文章,需要你的鼓励

2014

07/15

18:00

分享

点赞

邮件订阅
白皮书