在本周举办的Hadoop峰会上,Actian公司表示其将以进一步提升Hadoop紧凑程度的方式在业界掀起巨大波澜。看起来他们所言非虚,依靠其Vector产品、该公司确实已经实现了这一承诺。Actian公司顾问兼阿姆斯特丹大学高级研究科学家Peter Boncz教授在这里与他的在读博士生们讨论了纵列数据库在设计上如何给分析数据库系统带来变革,又是怎样在单服务器领域一路保持领先。
“它是目前市场上速度最快的数据库引擎,”Boncz不无自豪地指出。“它率先采用了多项正逐步走向主流的先进技术。”
早在着手开发原本被称为Vectorwise的Victor产品之前,Boncz就已经拥有非常丰富的分析型数据库系统设计与构建经验。他在Vectorwise产品之前就曾经使用过此类设计思路,相关成果也当之无愧地成为最早的纵列存储数据库之一。“它掀起了一股浪潮,自此在关系领域中配备一套特殊分析型数据库引擎开始成为主流,”他解释道。“在此项工作结束的数年之后,我们又萌生出新的想法。我们将此视为绝佳新机遇,并最终在Vectorwise当中成为了现实。”
根据Boncz的说明,当Vectorwise被创造出来时、Hadoop项目还仍然处于起步阶段,但Vectorwise却切实成为Hadoop基础设施当中的原生组成部分。“从某种意义上讲,我只能说我们交到了好运,因为Vectorwise的设计方案能够与Hadoop以及HDFS(即Hadoop分布式文件系统)顺畅对接,”他表示。“HDFS真的很难被导入现有数据库系统,因为它仅仅是一种文件系统。通常情况下,它本身无法实现直接导入。”
他解释称,Vectorwise所采用的纵列存储机制对于数据来说并不算是合适的打理方式。“在纵列存储机制中,大家需要寻找其它方法来进行数据更新。而这已经深深融入了Vectorwise的血液当中,”他指出。正是这种先天特性让他的设计成果能够轻松融入HDFS的原生环境。“以原生方式融入Hadoop的第二项标准性成就在于YARN集成。大家必须保证能够在对Hadoop资源进行管理的同时,既不会导致其它作业发生崩溃、也无需干扰到任何也在使用这套Hadoop集群的其他用户。”
Boncz认为,企业用户应当认真考虑Actian Vortex而非继续依赖他所谓的“遗留组合”。通常情况下,企业用户会将SQL/Hadoop解决方案作为组件添加到传统数据库系统当中,但需要强调的是这类数据库系统在设计思路上往往根本没有考虑到分析型工作负载的具体要求。他警告称,这样的处理方式并不适合执行高速查询操作。“这也正是Vortex在执行速度上远高于传统系统的原因所在,”他解释道。除此之外,Vortex还能给企业竞争力带来提升,因为它支持分流更新机制、从而避免系统更新所带来的HDFS关闭状况。
“SQL用户及相关用例往往是将成熟度放在第一位,这其实是种很大的误解,”他指出。“Vortex将彻底改变这一切。”这是因为Vortex所采用的迥异更新机制能够帮助大家在更新的同时继续执行写入操作。“这使得Vortex能够在无需对HDFS造成影响的前提下完成更新。我认为这一点在目前的市场上可谓独一无二。”
这款全称为Vector Hadoop Edition(也就是前面提到的Votex)的产品将由Actian以商用形式于本月底推出评估版本。大家可以点击此处访问Actian公司官方网站,届时这里将提供下载。Boncz还建议称,希望深入了解Vortex如何运作以及能为业务带来何种帮助的朋友不妨点击此处查看他最近发布的博文。
好文章,需要你的鼓励
本文探讨了 SBOMs、HBOMs 和 CBOMs 如何帮助企业全程掌握软件供应链组件、及时发现和修补漏洞,并满足法规要求,从而提升网络安全防护水平。
本文探讨了在不断增长的计算需求与多租户环境下,如何利用集中式管理(包括BMS、PUE监控、冗余设计及自动化监控)确保数据中心各系统(从电力、冷却到网络安全)的高效协同运作,从而实现高可靠性和零停机时间。
文章探讨企业选择大型语言模型时应结合业务目标、数据质量、集成及安全性,通过详尽调研和试点验证实现渐进部署,避免资源浪费与安全风险。
本文详细介绍了如何通过 ChatGPT 等 AI 工具构建并优化个人简历,包括资料整合、格式调整和改进建议,帮助求职者在激烈竞争中突出优势。