惠普及Supermicro前数据技术高管指出 块存储即将走向灭亡

块存储即将走向灭亡,对象存储在速度上优于文件存储,而存储级内存未来将成为服务器之上的惟一本地存储机制,Robert Novak如是说--那么,他到底是何方神圣?

 惠普及Supermicro前数据技术高管指出 块存储即将走向灭亡

当年进行普查数据处理时,对打孔卡进行打孔时的情景。

块存储即将走向灭亡,对象存储在速度上优于文件存储,而存储级内存未来将成为服务器之上的惟一本地存储机制,Robert Novak如是说--那么,他到底是何方神圣?

作为一名杰出的技术人员,Novak不久之前还效力于惠普服务器旗下的超大规模业务部门,而他的个人从业经历也相当风光:2012年4月至2014年12月担任Nexenta Systems公司系统架构主管,并于2014年在VMworld大会上公布了NexentaEdge--这是一款向外扩展存储架构,能够提供覆盖大量集群的全局命名空间,同时实现全局化内联重复数据删除、动态负载均衡以及容量均衡等功能。

而在此之前,他还曾于2008年7月到2012年4月担任Supermicro公司的企业级服务器业务主管。他的简历还包括在Sun公司的八年从业经历,两年效力于MIPS以及六年任职于Pyramid。再有,Novak还撰写过《软件定义数据中心傻瓜指南》一书,并于去年正式出版。

而从今年7月开始,他开始为自己参与的一家初创企业寻求融资,同时申请了两项与对象存储管理新机制相关的技术专利。

我们与Robert展开了一系列对话,希望了解他对于存储技术的看法。当然,也希望大家乐于了解这位技术大牛的思路,并享受获取答案的过程。

记者 Robert,为什么块存储即将走向灭亡?这与打孔卡之间又有着怎样的联系?

Robert Novak 我在存储行业已经工作了很长一段时间。我曾经向那些大二的计算机科学学生们教授关于Unix文件系统的知识以及如何利用inodes(目前已经被更名为metadata)来追踪文件被保存在磁盘驱动器上的哪些存储块当中。

在最近的工作当中,我审视了各类新型文件系统,并通过收集一切与存储以及文件系统相关的论著来支持自己的研究任务。

而在每一部论著当中,其开头出奇一致地以"单元记录装置"作为起点。绝大部分读者朋友还很年轻,没有经历过那个时代;不过相信很多人都听说过,当初IBM大型机的一大显著特色就是使用80列打孔卡。这种卡片其实代表着一项古董级别的技术方案,也被称为何勒内斯卡,其最早曾被用作地铁车票。

惠普及Supermicro前数据技术高管指出 块存储即将走向灭亡

何勒内斯打孔卡

这种所谓"单元记录"机制的存储能力太低,不足以在存储设备上实现分别记录(甚至连如今仍在使用的磁带也存在这一问题),因此其单元记录信息会被整理成记录组,也就是"块"。那么这跟我们现在讨论的存储块有什么关系?这个嘛,块机制可以说是何勒内斯卡所实现的第一种大型应用场景了。早在1890年,美国人口普查局就开始利用何勒内斯卡承载普查数据,而后利用分选机对这些数据进行整理与排序。

正因为如此,我才会认为我们在计算机上使用"块"存储机制的历史已经长达125年。

记者 对象存储机制是否基于底层文件存储?这一切又是如何实现的?

Robert Novak 大多数对象存储机制会首先将大量对象存储为文件集合。当然,也有一部分对象存储机制会直接在其文件系统当中立足于块进行对象管理,不过总体来讲大多数对象存储方案以文件存储为基础且在文件存储内进行空间划分以区别元数据(包括对象名称、创建数据以及数据归属等等)与数据(包括图片、视频、文档)。这种分层机制可以通过以下图片来理解:

惠普及Supermicro前数据技术高管指出 块存储即将走向灭亡

对象存储分层示意图

记者 那么键/值存储与直接磁盘寻址是如何改进这一存储过程的?

Robert Novak 让我们先来谈谈键/值存储是怎么一回事。2013年,希捷公司公布了相关计划以构建键/值存储设备,也就是"Kinetic"驱动器。该系列驱动器于2014年,也就是一年之后正式投放市场。

有了这类驱动器,大家用不着了解磁盘本身或者驱动器上存储块的实际大小,甚至不需要知道数据到底被保存在驱动器上的哪个位置。

我们所需要掌握的仅仅是其中的"键"(在Kinetic驱动器当中,键最大可为4096 bit)。事实上,我们可以将键/值存储看作是类似连锁干洗店那种运作模式。大家只需要把自己的衣服送到干洗店中,交给专业人员负责清理即可。对方会让顾客保留一份票据,其上有着与衣物相对应的编号。

几天之后当我们重返干洗店并打算拿回自己的衣物(也就是'值')时,如果忘了带上票据,那么服务人员的回答肯定是"没有票据,就没有衣物"。

键/值驱动器的工作原理就是这样。只不过与干洗店不同的是,这里的票据或者说"键"不是由对方提供,而是我们自己针对数据所创建--当然,键本身需要具备全局惟一属性。

从差异角度来看,键/值存储机制意味着主机服务器根本不知道数据被保存在设备的哪个位置当中,也就是说其中不存在其它文件系统上所常见的数据关联性。正是这种关联性引发了块指针重写问题,进而导致叠瓦式磁存储方案无法在相当一部分文件系统当中顺利起效。

在键/值驱动器当中,数据是不具备"地址"的。驱动器的"地址"则表示为向其分配的一个或者多个IP地址。不过在使用了合适的广播或者多播技术之后,大家甚至根本不需要了解具体驱动器的地址。我们只需要在使用数据时返回并进行查询即可。如果换一种角度来解释,键/值机制代表的其实是一种延后绑定方案。

对象存储/块存储速度比较

记者 那么对象存储机制会给使用直接IP地址的驱动器带来哪些影响?

Robert Novak 通过在存储设备上直接存储对象,我们不再需要将某个对象的名称转译为一组文件名集合--这些文件名代表的是元数据文件的"家族",旨在将富元数据与对象关联起来。

其中存在着类似的包含一个或者多个文件的"家族",用于将对象表示为本质上属于文件"片段"的单一文件或者多个文件。现在,我们可以直接实现PUT(面向键与值)或者GET(面向键)。

记者 那么对象存储在速度表现上能否与块存储相媲美?

Robert Novak 与主流观点相反,对象存储的性能表现实际上要比块存储更出色。在相关模式示意图当中,我们可以看到块存储已经开始通过渐进式转变来实现更理想的数据访问速度水平。

在早期磁盘驱动器当中,最快的访问速度要求数据以连续块形式保存从而保证面向磁盘驱动器的读取操作以连续方式完成。不过随着时代发展,相关情况也变得更加复杂,如今RAID技术的介入使得数据读取需要跨越多块驱动器来实现。

不过在对象存储方面,如果大家将数据本身拆分成片段并将各片段(可能包含冗余部分)保存在多块不同驱动器当中,那么我们就能够在读取数据时享受到类似于P2P种子的获取方式,这意味着我们能够突破入境数据通道(例如以太网端口)的传输带宽极限。

记者 文件存储机制是否会受到直接IP地址驱动器的影响?

Robert Novak 如果我所申请的专利技术能够获得成功,那么这方面影响将相当显著。可以看到,如果将文件与块以键/值驱动器对象的方式进行存储,那么整个索引过程的速度将远高于传统块存储机制的实际水平。

惠普及Supermicro前数据技术高管指出 块存储即将走向灭亡

Kinetic类驱动器上的对象存储分层示意图

除此之外,新型方案不会像传统文件系统那样在与叠瓦式磁记录或者闪存转换层对接时面临诸多挑战--这些挑战会严重拖慢数据的访问速度。

记者 您如何看待存储业界的目前状况?

Robert Novak 首先声明,这仅仅是我的个人观点而且不能代表任何业界主流厂商的意见--目前存储行业正处于以合并与紧缩为核心的状态之下,这是因为用户所产生的数据总量正在大幅提升,而这种转变已经对我们管理以及存储数据的具体方式产生了重大影响。

很多人可能还没有意识到,在对象存储模式的支持下,相较于过去四五十年,我们将能够在降低存储容量需求的同时拥有可靠的数据保留手段。

在过去,如果大家身为CIO,那么除了不可或缺的RAID/MIRROR在线存储机制之外,我们通常还需要以每天、每周、每月或者每年为周期为数据保留2到10份备份副本。

其中一部分副本需要保存在异地以实现地理层面的数据布局扩散,从而通过灾难恢复体系应对各类环境性灾难(包括飓风、龙卷风、地震或者洪水)、政治性灾难(将数据迁移至海外以避免其内容被政府当局所窥探)乃至冲突性灾难(例如911事件)。

对象存储能够实现全部上述目标,并在保证与传统存储相当的可靠性目标的基础上将成本降低50%到80%。

记者 那么公有云又会给存储行业带来哪些影响?

Robert Novak 公有云属于通过对象技术节约存储空间的具体方案之一。不过它的问题在于,云环境下的数据访问只有在WAN级别传输速度这一前提下才具有实际意义。换言之,如果只是用于向智能手机或者平板电脑交付数据那就比较合适,但在与面向归档记录的分析应用相配合时则表现较差。

除此之外,公有云的存储资源使用成本其实存在着一定欺骗性。对于智能手机或者平板电脑端的数据,公有云的使用成本算是比较友善。但一旦面临大规模数据存储需求,那么对云数据进行检索所带来的成本将远高于将数据存储在企业内部这种传统型方案。

就短期来看,我们将迎来存储单元数量的扁平化转变趋势,因为企业管理者在做出存储设备购买决策之前会首先评估使用公有云资源的可能性,特别是在面向灾难恢复以及冷门数据等存储需求的情况之下。

他们已经购置了过量的存储空间(旨在实现RAID性能优势),而在进行下一波采购之后,他们首先需要想办法将自己的现有资源充分利用起来。由于目前大多数企业都在想办法削减可自由支配的预算,因此当存储方面需要的预算量太过庞大时,会有越来越多的管理者决定利用云实现短期成本节约。

记者 您对于目前大型存储供应商的合并浪潮感到忧心还是开心?

Robert Novak 从目前的合并浪潮可以看出,各大存储厂商的管理团队实在有点缺乏想象力。他们根本无法带领用户迎来一套真正的全新存储模式。作为合并态势的组成部分,相当一部分企业还在进行裁员--而且其中相当一部分都是真正拥有创新能力的团队以及技术成果。

记者 那么您认为初创企业会迎来怎样的前景?

Robert Novak 从短期角度讲,初创企业的出现速度可能会有所放缓,这是因为很多投资者会将目前的合并趋势视为一种警告。目前对此有两种主要观点,其一是合并的出现是因为存储业界无法容纳这么多从业厂商。

而另一派则认为合并趋势的存在是因为大型厂商没有实施以及改进新型技术,而当下正是向初创企业砸下投资的最佳时机。

持后一种观点的群体相对较小,而且考虑到相关开发周期,向初创企业砸钱意味着投资者可能需要在很长时间之后才能获得回报。

我个人真心希望能够找到乐于在发展早期就向颠覆性市场转型驱动企业砸钱的投资方。

记者 那您对存储业界的未来有何看法?

Robert Novak 存储行业将一步步摆脱SAS/SATA这类只适用于单一服务器的存储机制。采用无状态UDP连接机制的以太网连接型存储设备将呈现出越来越高的智能化水平,从而处理更多必要性存储与搜索功能。而除了引导与交换操作之外,服务器将不再使用任何本地存储资源,甚至会随着时间推移而彻底消除对本地存储方案的依赖性。

惟一的"本地"存储机制将只剩下Tier 0存储类内存,数据在一段时间未受访问之后将被从这里移出并复制到其它速度更慢的存储层当中。

记者 看起来我们面临着大量需要思考与消化的问题。而且在访谈过程中,我们不禁想到了Nasuni公司CEO Andres Rodriguez在讨论对象存储与底层文件系统时也曾给出过类似的观点。

Kinetic类驱动器的潜在光明前景确实令人眼前一亮。当然,如果大家对于Robert的意见不甚认同或者觉得还有某些关键性因素未被他考虑在内,请在评论栏中分享您的看法。

来源:ZDNet存储频道(编译)

0赞

好文章,需要你的鼓励

2015

11/16

09:32

分享

点赞

邮件订阅
白皮书