扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共3页)
GPFS整合Hadoop,IBM的大数据分析野心
媒体提问:刚才说到了IBM的存储是和数据分析结合在一起的。你说的Netezza这个产品,是帮助存储业务大幅度的增长,但是Netezza这个产品是软件产品。从硬件角度来看你们的大数据战略有哪些呢?
Douglas M.Balog:大数据是IBM非常全面的战略是面向整个市场的战略,除了Netezza软件,还有系统分析解决方案,它包括了很多面对市场的不同需求,像入门级的需求都是包括的,还有一些更多的软件产品Cognos等等也是我们的存储软件,都是为了满足客户的需求,可以看到我们这个大数据解决方案其实是我们的一些设备加上客户解决方案一起来满足客户需求的。
媒体提问:大数据包括很多方面,其他的竞争对手都在做,EMC有一个Greenplum,甲骨文有自己大数据的解决方案,他们都有自己的分析业务,比较之下IBM的优势在哪里?
Douglas M.Balog:IBM收购了上百个专门做分析的软件公司,我们既能够提供基础的架构这一层面的业务分析的能力,也能提供更多的行业的业务分析能力,我们的产品组合和业务分析能力,以及我们收购的上百家公司的能力是竞争对手不能对比的。
媒体提问:Hadoop是大数据方面较有影响力的开源技术,各厂商也在Hadoop方面各自提供自己的支持,请问IBM将如何支持Hadoop?
Douglas M.Balog:IBM具有很强的分析组合产品,比如说我们有一个中间件产品Big insight,可以与Hadoop一起使用,在Hadoop的基础上使用InforSpere BigInsights产品,就可以把Hadoop的文档系统和IBM的基础架构很好的结合,就可以生成GPFS。这样IBM就把它的硬件和文档系统以及软件以及Hadoop很好的结合在一起。
下面是半年前的采访:
笔者:目前谈到云存储和大数据,Hadoop(包括HDFS文件系统)是一个关注的焦点。开源是Hadoop的一大优势,比如EMC收购的Greenplum就在与Hadoop结合,NetApp也在研究相关方案。IBM对Hadoop持何种态度?Netezza可能会和Hadoop产生某种联系吗?
Vincent Hsu:Hadoop是一个大的趋势,非常适合做大数据分析的。IBM有一个很有亮点的技术叫做GPFS(通用并行文件系统),我们正在做GPFS和Hadoop的整合,将来你会看到IBM有针对Hadoop优化环境的(存储/设备)来运行相应的工作负载。
去年的SNW2011大会上,在SNIA(全球网络存储工业协会)的一个演讲中,我们看到IBM GPFS可以替代HDFS作为Hadoop架构的底层文件系统/数据存储。而在上面的应用开发层,商业方案/接口(Commercial Project / Interface,相对于Hadoop开源方案而言)中第一个列出的就是IBM Bigsheets(大数据表)。
GPFS和SONAS在有些观念上是不一样的,SONAS虽然也是Scale-out,但它所有的存储还是以共享式的存储为主;而Hadoop(也包括HDFS)本身是分开的。我们现在让GPFS也能处理这些分散的、分布式的数据存储,与SONAS使用同样的技术,但支持的工作负载和架构是完全不一样的。 点评:GPFS与Hadoop的结合是一种分布式文件系统的形式,专门针对大数据分析的应用;而作为集群NAS产品的IBM SONAS则具备更多的适应性,主要面向高性能计算、海量媒体(音/视频)数据的存储。
Vincent Hsu:IBM在过去这5年收购了一些做分析工作负载的软件(包括Netezza?笔者注),现在我们正在做分析软件和Hadoop环境的结合。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者