扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
来源:ZDNet存储频道(编译) 2014年3月18日
关键字: PIVOTAL Pivotal HD 2 开源
由EMC与VMware通过分拆而建立起来的Pivotal公司正努力攻克大数据处理技术领域最难以逾越的障碍,旨在借此从开源项目中攫取可观收益。
本周一,Hadoop发行版Pivotal HD 2.0与分析引擎Pivotal GemFire XD陆续面世,该公司希望通过打造一系列技术方案帮助企业用户从庞大数据当中取得潜在价值、同时又无需面对即使对于技术大师而言也极为困难的传统Hadoop接口。
这两款软件将互相配合,为企业用户带来一款用于存储Hadoop文件系统(简称HDFS)内累积数据的内存内SQL数据库,并利用一款名为HAWQ的引擎借助SQL之力实现数据查询。
除此之外,HAWQ也已经获得了与GraphLab OpenMPI以及MADlib的整合能力,并借此通过一系列集成化分析算法对相关数据以及图形进行分析。它还拥有极佳的语言兼容性,能够接纳以R、Python以及Java等语言编写的查询指令。
在一份新闻稿中,Pivotal表示此次发布的产品将“构成‘业务数据之湖’(即Business Data Lake)架构的基础”——这样的语言表述实在让人有些头晕目眩、不知其所谓。
抛开营销角度不谈,这项技术算是Pivotal对于企业用户内部结构化与非结构化类型数据不断增长的一种回应。Pivotal希望各位买家愿意投入重金以获得在单一集成化软件模块堆栈内实现数据提取、存储、分析以及查询的能力。(Pivotal并没有透露产品的具体价格,而是鼓励企业用户积极与其联系、通过直接交流在自身可以承受的范围内选择企业定价策略。)
Pivotal将开源与专有技术加以融合
为了达成这一效果,该公司在其Hadoop发行版的基础之上添加了无数额外组件;据Pivotal预计,其模块化架构能够帮助用户在无需对应用程序代码库进行重复调整、从而保证固有结构清晰的前提下,随时间推移轻松对软件进行更新。
该软件的未来开发方向包括多租户、Hadoop强化以及添加Apache Spark等其它开源项目。
“多租户将成为未来的一大重要主题,我们希望在下一阶段专注于利用自己的数据结构满足不同规模及类型的用户在处理各种差异化工作负载时所面临的需求,”Pivotal公司Pivotal HD堆栈产品管理负责人Anant Chintamaneni在一次采访中表示。
尽管Pivotal HD所带来的最大改变在于以Hadoop为基础实现具备专有性及易用性的数据及分析接口,但Chintamaneni也提到原本的Hadoop方案对于部分企业用户来说难于驾驭。
“在客户的部署过程中,我们也将始终为其提供指导及帮助,”他解释称。“大家必须明确规划好如何将技术方案融入实际业务流程。如果大家希望在同一套集群之上运行HBase以及HAWQ,则必须为二者进行有针对性的集群划分。”
该公司甚至有可能在未来提交自己的开源贡献,他证实,并表示该公司正在考虑将一部分技术成果提交给Hadoop的高级YARN作业调度方案。
Hadoop这一复杂技术工程原本可能仅仅是精通技术的大型企业的专属,但Pivotal将赌注押在了对其进行易用性转化之上,并希望最终借此让开源项目成为自己的收益来源。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者