科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道专访NetApp:过去、现在和将来

专访NetApp:过去、现在和将来

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

Dave Hitz 作为执行副总裁,负责制定 NetApp 的未来战略和方向。他和 James Lau 怀着要像 Cisco 简化网络一样简化存储的热情,于 1992 年共同创立了 NetApp。Dave 以前在 Auspex Corporation 担任过高级工程师,也在 MIPS Computer 从事过工程方面的工作。

作者:存储时代 2008年5月19日

关键字: 重复数据删除 存储虚拟化 FC SAS VMware 数据中心 NetApp

  • 评论
  • 分享微博
  • 分享邮件

采访嘉宾

 专访NetApp:过去、现在和将来

Dave Hitz,NetApp 创始人兼执行副总裁

Dave Hitz 作为执行副总裁,负责制定 NetApp 的未来战略和方向。他和 James Lau 怀着要像 Cisco 简化网络一样简化存储的热情,于 1992 年共同创立了 NetApp。Dave 以前在 Auspex Corporation 担任过高级工程师,也在 MIPS Computer 从事过工程方面的工作。在从事计算机行业的职业之前,Dave 曾是一个牛仔,在牧场积累了宝贵的管理经验。

在最近的 NetApp TechTalk 播客中,Worldwide PR and Internal Communications 的高级主管 Eric Brown 询问 Dave Hitz 有关数据中心内技术变革。Dave 与我们分享了他的观点,阐述了他没有预料到的变化和他所看到的引导我们前进的变化。完整的采访稿只能从 Tech OnTap 获得。

Eric:Dave,让我们谈谈数据中心的基本转移。现在有什么您没预料到的情况出现?在可预见到的未来您会看到发生什么?

Dave:五年前,如果您问我看到什么正在走来,我肯定不会说 VMware。我根本没预料到它的出现。自从 VMware 出现以后, 它以我从未预计过的方式席卷这个世界。同时,我不确定我是否预料到我们的技术可以被证明在 VMware 环境中那么有用。

Oracle Open World 举行时在我们的展台上,有一个 VMware 的合作伙伴工程团队的成员正告诉客户,为什么他认为 NetApp 存储对于 VMware 来说是了不起的。他的工作是研究 VMware 可以配合合作伙伴做哪些工作来让 VMware 变得更好。他使用安装在 Linux® 平台上的 Oracle® 数据库,演示在 NetApp 存储系统上使用 FlexVol® 要用多长时间能制造 25 个 VMware 虚拟服务器副本。只花了几秒钟时间就得到了 25 个副本。克隆是 FlexVol 精灵卷最引人注目的功能。多年来,我们一直专注于使用 FlexVol 进行测试和开发。然后我们的合作伙伴走过来说,他猜想 FlexVol 还有许多我们没有想过的用处。我认为他是正确的。现在我们很好奇,“可以将克隆用在其他用途吗?”

我们已经拥有一段时间的另一项技术是重复数据删除,也称为 dedupe。重复数据删除总的来说是一个好主意。但是当重复数据删除碰到 VMware 时,它可以提供令人惊骇的数据减少。根据定义,VMware 克隆副本是冗余的,是用于通过重复数据删除缩减空间的很好的候选内容。在一些区域中有虚拟桌面接口,您在其中创建某些内容的 1,000 个副本。这一千个副本中的每一个几乎都相同。您可以在此实例中使用重复数据删除来节省 1,000:1 的空间。想要更好地节省空间?创建 5,000 个虚拟桌面。

三或四年前,存储联网世界的每个人都在执行某种形式的重复数据删除。有很多种方法可以执行此任务。我们已使用 Snapshot™ 副本进行过长期的重复数据删除,因为此技术可让我们拥有很多副本,同时保持大部分块相同。有许多人正将重复数据删除用于备份。我们使用自己的重复数据删除,用于我们的辅助存储系统的磁盘至磁盘备份。但是我们也会执行一些不平常的工作。我们还将重复数据删除用于主存储。目前,我想我们允许用户对主存储使用重复数据删除是行业内唯一的。

通过使用重复数据删除,您可以在多方面获得好处。某些方面的好处令人惊讶。我们最近对运行大量基本相同系统的 VMware 客户进行了一次测试。有了虚拟桌面,严格来讲,您可以拥有数千个一样的系统。在我们进行的测试中,我们看到通过重复数据删除节省了 95% 数据空间。现在,我想清楚地说明:我并不是说重复数据删除可以在所有地方都将数据减少 95%,但是在特定的应用程序中确实可以通过重复数据删除节省大量的空间。

Eric:让我们回到 VMware。人们通常认为存储虚拟化和服务器虚拟化是两个不同的概念。您认为它们之间仍然有差别吗?

Dave:首先,“虚拟化”这个词是一个大问题。“虚拟”这个词在计算机科学领域已使用了好多年,当您只说“虚拟”这个词时,没人知道您在说什么。VMware 的主要观念是虚拟系统解决了数据中心内未充分使用的系统的根本问题。它解决了如何提高利用率的问题。

存储端的虚拟化也跟利用率有很大关系。简化配置是有关不浪费空间的配置,例如当某人走到您面前对您说,“我准备创建 3TB 的数据库。请给我 3TB LUN。”您看着他们问到,“您确定吗?”然后他们回答到,“嗯,当然,这个数据库将要存储越来越多的数据。实际上,令人痛苦的是这个数据库会不断增长,还是给我 4TB 吧。”然后您在一年后再回顾一下,发现分配给他们的存储只用了一半空间。在那种环境下,虚拟化非常重要。

如今,我想无论何时有人说“虚拟化”,他们的意思是 VMware、Xen 和 Viridian。真正的问题是“在数据中心内进行虚拟化有什么问题?”因为当您虚拟化服务器时,在服务器后面有等待发生的存储问题。使用虚拟化,您可以即时配置新服务器,但是如果没有存储虚拟化,您将要花多长时间来配置新存储?如果您可以在不添加 CPU 的情况下配置新服务器,则下一个问题是“您可以在不添加磁盘驱动器的情况下配置一些新存储吗?” 什么是虚拟化 VMware?它是简化 CPU。

Eric:数据中心有其他新事物使您感到惊讶吗?

Dave:我并不很理解应用程序集成将带给我们什么。我无法预测我们是否会让一个团队研究该做些什么让 Exchange 从存储视角看更加好,我们能给 Oracle 数据库管理员提供什么功能,以及我们使用 SnapManager® 系列产品能直接为数据库管理员 (DBA) 做些什么。存储供应商和客户的挑战是:大多数人都在考虑完所有其他内容以后,才考虑存储。大多数人首先想到如何解决他们的关键业务问题以及需要执行该任务的应用程序。他们首先考虑 Oracle Financials、SAP 和 Exchange,然后考虑存储。离应用程序越近,您的产品将与该应用程序更加相关。

Eric:让我们追溯一下应用程序集成。在购买 Oracle、SAP 或 Microsoft® SQL Server™ 后,他们考虑存储时会想到 SAN、NAS 或直接连接。他们要考虑什么?

Dave:销售带有高级功能的存储系统时其中一个最大的挑战是解决如何让实际使用存储的人访问那些高级功能。让我举一个具体的例子。在 Oracle Open World 上,我向 Activision 的 CIO Neil Armstrong 介绍产品。他运行整个 Oracle 套件,包括数据库和电子商务套件。他喜欢 Hyperion 产品,因为他已经是 Hyperion 用户。他面对的挑战是如何为需要完成的各种任务创建整个产品数据库的副本。创建单个副本的过程要一个星期。实际上,创建副本对他而言是很痛苦的事情,他将任务推回给想要副本的人。这对他而言太痛苦了。他想在进行主要的业务流程重组之后可以做得更好,可以将完成整个流程的时间降低到四天。他很兴奋。在他购买 NetApp FlexClone® 后,创建整个产品数据库的副本只要花四个小时。

下面是挑战。并非所有存储系统天生是同等的。NetApp 系统有克隆功能,可让 Activision 在四个小时内创建数据库的副本。他们以前的环境就是不支持该功能。但是这只解决了部分问题。还要注意的是:DBA 如何使用那个存储功能?他们不得不呼叫连接 LUN 的服务器人员,然后服务器人员不得不与存储人员交谈,然后存储人员 … 真乱啊!

应用程序集成就是要创建一个使用数据库管理员的语言或 Exchange 用户的语言的应用程序。要这样做,您必须定制应用程序集成,专注于 DBA 或用户关心的问题。在 Oracle 环境中,其中一个大问题是测试和开发。使用 Oracle,您的生产环境运行得很好,但是您仍然需要能够为测试和开发创建克隆。Neil 一直创建这些克隆。他对我说,“我可能创建了 12 个。有些人想要授课,他对我说,‘可以给我一个克隆进行一些培训吗?’‘当然,没问题’。我以前从未给过他们克隆。”是什么让 DBA 能够说“没问题”?这就是应用程序集成的作用,也就是您需要为特殊任务优化存储解决方案的地方。

采用 SnapManage for Exchange ,重要的是我们恢复整个邮件环境中的单个邮箱是多么容易。我们提供的每个 SnapManager 产品都为特定的应用程序环境调整过。SnapManager 为存储世界(如果您不是存储人员,将很难理解存储世界)创建一座到达应用程序级的桥梁,这样更多公司将时间花费在业务方面。
Eric:让我们从大的方面转向某些特殊技术。iSCSI 或 IP SAN 看起来在过去两年真正获得了成功。您对此有何看法?

Dave:首先,我必须说,NetApp 非常认真地对待以太网存储。我们在最近的 Storage Networking World 展会上演示了以太网上的光纤通道 (FCoE)。FCoE 还不成熟,而 iSCSI 已经开始销售,有许多人正在非常高端的生产环境中使用它。我想知道 FCoE 是否真的比 iSCSI 好得多,或者这只是不准备使用 iSCSI 的人的一种策略,只为减慢市场节奏。以后可能会证明 FCoE 非常棒。但是如果您认为以太网上基于块的存储就是您所感兴趣的,那么不要等待,赶快行动。如果您从 NetApp 购买了系统,现在就可以使用 iSCSI,而且您可以在某天切换到 FCoE,这不是问题。但是不要傻傻地等待。

Eric:嗯,对,技术肯定是即时性的,因此如果不必等待,为什么一定要等待呢?让我们从协议切换到磁盘驱动器技术。串行连接的 SCSI 或 SAS 驱动器看起来在市场上占有率很高。您怎么认为呢?

Dave:下面是我对磁盘驱动器行业的大概看法。他们销售两种类型的磁盘:昂贵的磁盘有高利润,而便宜的磁盘利润低。那么想象一下腓力牛排和麦当劳。

当新磁盘驱动器技术出现时,您都必须了解它是何种类型。当您考察昂贵的磁盘驱动器时,会发现它们比较贵的原因。他们有更高的转速,通常有更快的寻道时间。它们更好。光纤通道驱动器也更可靠。便宜的驱动器转速更慢,要花更长时间读取数据,并且可靠性也不高。因此您一定要了解要将磁盘驱动器用来做什么。

我很关心磁盘驱动器行业正在谈论的串行连接 SCSI (SAS):它在两方面都表现很好,价格便宜而功能又强。我并不真正相信它。我的直觉告诉我等到 SAS 变得更加成熟,它将替代光纤通道。互连有一些非常好的特性。我特别喜欢的是互连允许插入 SAS 或插入 SATA。您可以建造一个支持任一种连接的盘柜,便于人们更容易在便宜的驱动器和昂贵的驱动器之间进行选择。看看!同一个碟子盛着腓力牛排和麦当劳的汉堡包。

Eric:现在让我们综合谈论一下磁盘的未来。硬盘会渐渐被人遗忘吗?在磁盘驱动器行业里闪存意味着什么?

Dave:硬盘会由于闪存的出现而渐渐被人遗忘?首先,肯定不会。磁盘驱动器行业的容量提高实际上已经减缓一段时间了,但是通过使用垂直记录技术,又加快了这个进程。目前,磁盘驱动器的发展与闪存一样快,并且在容量方面有提高。因此,需要大量存储的人短期内不打算使用闪存。

闪存适合用于哪些地方呢?考虑一下 iPod。早期一些版本的 iPod 使用硬盘驱动器。而最新一代的 iPod 只使用闪存。膝上型电脑的情况也相同。实际上,现在我的膝上型电脑上所有个人数据都存储在闪存上。即使在高端企业存储环境,闪存也将适合用于提高性能。看看闪存,它的价格比磁盘贵大约 10 倍。对于随机存取,它可以快上百倍。因此将闪存结合到您的体系结构中将会很有用。同样也可以使用 RAM 让您的高速缓存更大,还可以使用闪存让您的高速缓存非常大。我想这就是闪存的发展方向。

Eric:您能谈谈有关备份技术的更多信息吗?对于虚拟磁带库的未来您有什么看法?

Dave:听我讲一个有关虚拟磁带库的故事。当我们买入 Alacritis 取得虚拟磁带库时,他们感到很惊讶。他们知道我们已经有从 Virtual Tape Library 取得的很多磁盘至磁盘备份功能,他们想知道为什么我们还要购买他们的产品。我想有一点很重要,磁带已深深地嵌入大型企业的备份流程中。他们喜欢整套磁盘至磁盘设计。磁带对于大多数应用程序而言并不够快(当然对于恢复也不够快),因此他们开始寻找中间技术。VTL 非常适合作为中间技术。虽然您考虑到它,但是大多数不会使用 VTL 替换磁带。他们说,“您知道,我已经习惯每晚使用磁带,但是现在我只需每星期使用一次,甚至是每月才使用一次”。他们也使用 VTL 来将数据缓冲到磁带上,因为实际上在启动和停止时会减慢磁带的速度。如果他们通过 VTL 缓冲数据,则可以在现有的磁盘基础设施上获得多得多的吞吐量。

Eric:对于连续数据保护或 CDP,您有什么想法?

Dave:最大的问题是“连续”到底意味着什么?有些人说对于备份他们最讨厌的事情是,如果他们丢失了数据,就不得不完全返回到前一夜的备份。对于他们来说,连续备份可能意味着每小时备份一次。15 年来,NetApp 都是每小时制作一个 Snapshot 副本。这根本不是新内容。但是有些人认为 Snapshot 间隔要完全达到毫秒时,才算是连续的。我的问题是“您需要的间隔到底要多小?” 我对上一毫秒间隔表示怀疑。在大多数环境中,当您使用 CDP 作为备份技术时,会谈到许多停机时间。您会重放日志文件,而在您重放日志文件时,问题是您是否能从日志文件中获取数据。我的经验告诉我一小时的间隔可能不够快。短到分钟的间隔可能比较接近要求,但是以秒为单位的间隔就足够了。我不是说以毫秒为单位的间隔一点用都没有,但是它可能只在非常特定的环境中才可能有用,成本限制了您实施这种间隔。

Eric:让我们谈谈存储和安全。有一个很大的问题是安全性,我们可以预计获得哪些进步?

Dave:我想数据安全仍然是一个大问题,特别是在金融服务和医疗保健领域。这很重要,因为那些是您可以想到的最针对个人的主题。许多公司都有关于其财务保密性的 Sarbanes–Oxley 和安全问题,这只是他们的总体业务相对很小的一部分。至于谁要使用安全功能,我相信每家公司的主要压力来自总部、M&A 和财务部门。在医疗保健和金融行业,安全性将更广泛地部署,直到安全性成为每个系统的标准部分。达到这个标准时,很多人会说,“噢,很好,现在已经安全了,我可以启用它了。”那是我所看到的。
Eric:您看到安全性正移入网络吗?

Dave:Tom Georgens 是我们的负责产品运作的 EVP,他有一个有趣的理论。他认为大多数数据中心环境只对某些区域投资。他们有运行在服务器上的应用程序,他们有服务器,他们有连接所有设备的网络,他们也有存储设备。Tom 的理论是,人们实在不想管理基础设施的另一个区域。因此,他们可能会临时部署存储虚拟化设备或 Decru DataFort® 数据加密设备。随着时间的流逝,他们的战略问题出现了,他们是否想要永久地管理基础设施的另一部分,或者是否可以将它连接到已有的区域。当您了解存储的数据加密技术时,可以看到有两个放置加密的自然位置:fabric 或存储系统。我猜想随着时间的推移,它可以进入这两个位置。

Eric:您看到存储服务行业有哪些改变?

Dave:我喜欢存储服务。我们的许多渠道合作伙伴将存储服务作为他们业务的一部分。当您查看我们的业务模型时,您将发现我们专注于产品。然而,如果我们需要销售服务以便帮助我们的客户安装产品、使用产品和充分利用我们的产品时,我们也会销售类似服务。因为我们专注于产品,如果合作伙伴提供的服务可以与我们提供的一样好,或者在某些情况下比我们更好,则我们将很愿意让合作伙伴提供那些服务。也就是说,我们承诺提供世界上一致的高水平服务。

Eric:最后一个问题。您能总结一下过去几年从追踪数据中心发展所学到的东西吗?

Dave:我们今天看到的创新并不是来源于技术本身。如今的创新来源于旧技术的新用法和开拓现有技术的新业务流程。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章