十年前,在SAS标准仍处于初创阶段的时候,LSI就通过一年之内的两次收购,获得了AMI的RAID适配器部,从IBM手里拿下了Mylex,大大增强了在RAID领域的实力。
当时LSI在RAID卡领域的主要竞争对手是Adaptec,双方都希望能开拓服务器以外的市场。确切的说,虽然中高端服务器普遍配备SCSI RAID卡,但受Ultra160/320为代表的并行SCSI技术所限,一个双通道的RAID,真正能接的硬盘驱动器数量也不多。这很大程度上促使对存储性能要求较高的服务器,更倾向于使用外部的存储系统,服务器内置的RAID卡和硬盘驱动器,基本只用来安装操作系统和软件。空间受限的刀片式服务器出现后,加剧了这一趋势,甚至索性放弃内置硬盘驱动器,直接从SAN启动。
服务器市场对高性能RAID卡的需求不足,而当时的中低端存储系统还没有太多软件功能,其控制器的主要任务也是处理RAID、搬运数据,与RAID卡颇有共通之处。理论上,结合Fibre Channel、iSCSI等主机接口技术之后,RAID卡厂商做低端存储系统至少没技术障碍。Adaptec先行一步,在2004年以OEM的方式向IBM提供两款iSCSI存储系统,名为DS300和DS400。
也是在2004年,LSI公司把存储系统业务独立出来,成立了Engenio存储部门。此举目的有点不纯——上市,你懂的。但是那两年的金融环境不是很理想,加之OEM业务不容易吸引投资者的眼球,Abhi上任后彻底放弃了这一打算。
小贴士:要明白LSI RAID业务的变迁,有必要不太严谨的说一下RAID与JBOD的关系。从字面来看,RAID是Redundant Array of Independent Disks(独立磁盘冗余阵列)的缩写,JBOD则是Just a Bunch Of Disks的缩写,两者内涵都比较丰富,这里不展开。但是,在很多情况下,我们可以把JBOD理解为很多硬盘驱动器的物理聚合,包括必要的电路连接(如扩展器和磁盘背板)和供电、散热等,而RAID则通过运行在专用处理引擎(如RAID卡或CPU的XOR加速功能)上的软件赋予其智能。这就出现以下几种可能的组合:
- RAID和JBOD都在服务器内部实现,则共同构成服务器的存储子系统——于LSI而言,就是RAID卡业务;
- RAID由存储系统的控制器实现,连上JBOD,则构成完整的存储系统——于LSI而言,就是外部存储系统业务;
- RAID在服务器内部或没有RAID(如SAS HBA),JBOD在服务器外部——譬如,后面将要提到的Open Vault……
目的不纯也要有本钱,当时Engenio已经拿下IBM中端FC存储系统的OEM,号称业界第二大OEM存储供应商。反观Adaptec,因为DS300/400的反响不佳,丢掉了IBM的合同,继而被迫放弃了外部存储业务。Engenio顺势把IBM的低端存储系统业务也接了过来,即DS3000家族。
虽然IPO未成,不妨碍Engenio的业绩斐然。除了IBM的DS4000,StorageTek、Sun、SGI等厂商的中低端存储,主要都OEM自Engenio,包括戴尔低端的PowerVault也是(中端转销EMC),生意红火得很。
IBM入门级存储系统DS3500是Engenio部门的作品(现NetApp E-2600),其控制器(下半部分)相当于一个加强版的RAID卡:核心处理器③是LSISAS2116,这枚ASIC是集SAS控制器与RAID处理引擎于一身的所谓RoC(RAID on Chip),内置800MHz的PowerPC 440处理器内核,并提供16个6Gb/s SAS端口。而LSI同时期的SAS RAID卡(上半部分)采用的LSISAS2108,处理器内核也是800MHz的PowerPC 440,但只提供8个6Gb/s SAS端口。至于SAS扩展器(SASExpander④),两者更是一样的LSISAS2x36。顺便说一句,LSISAS2116还用在了LSISAS9200-16e、9201-16e和9201-16i等16端口6Gb/s SAS HBA上,但没有使用RAID功能……如此种种,足以说明LSI的RAID卡与外部存储业务之间的血缘关系
不过好景不长。还记得四年前,我向来京的LSI高管提了一个很长的问题,大意就是:Engenio的OEM客户中,规模小一些的如SGI状况不好,StorageTek被Sun收购,两家变成一家(通常1+1<2);大一些的如Dell收购了EqualLogic,肯定大力发展,合作范围不减小就不错……如此一来,Engenio的业务将变得高度依赖IBM这么一个大客户,潜藏着巨大的风险,你们如何应对?
没过多久,Oracle收购了Sun,逐渐加大对其ZFS存储系统的扶持力度,OEM过来的存储逐渐被边缘化,可谓雪上加霜。
LSI的应对之策包括拓展销售渠道,2010年LSI准备通过自己的渠道销售自有品牌的低端存储系统。但是工作还没有铺开,2011年3月初,LSI宣布将Engenio业务出售给NetApp!
饶是问过那样的问题,听到这个消息时,我还是颇感意外。一是不到半年前(2010年12月)的LSI存储论坛上,还谈论到了正在开发基于英特尔至强平台的下一代中端存储系统,NetApp应该不需要这个;二是4.8亿美元的价格与Engenio业务每年能带来的营收相比,有贱卖的意思。
我的问题部分应验——Engenio的生意不好做了。不过我们也不能刻舟求剑,行业环境已是此一时,彼一时。我相信LSI出售Engenio业务,一定也有出于技术发展趋势的考虑。既然如此,对于Engenio这部分业务所对应的市场需求,应该会有填补的手段。
在LSI的大力推动下,SAS成功取代服务器内部的并行SCSI和存储系统内部的FC-AL,统一了服务器与存储系统内部的接口。随后,在Intel的不懈努力下,以至强为代表的x86也在存储系统控制器领域压倒了PowerPC,有一统服务器与存储之势。
单论RAID处理能力(如XOR和P+Q运算),x86的效率不如PowerPC。但若运行更上层的软件功能如重复数据删除,甚至运行虚拟机,x86在处理能力、发展前景和生态环境上的优势明显。随着存储越来越趋向于成为软件行业,英特尔的强势入侵已不可避免。
换句话说,独立的存储行业,正在演变为在标准化或通用的硬件平台上,比拼专业数据处理能力的软件。LSI擅长的RAID已经“沦为”底层软件功能,缺乏相应的上层软件能力,继续做存储系统生意,竞争优势将不复存在。
IBM Storwize V7000的控制器,CPU是四核2.13GHz的Intel Xeon EC3539处理器,集成XOR等RAID加速功能,但主要是满足Easy Tier自动分层存储等软件的需要。在这个架构中,LSI只能争取SAS IC + SAS扩展器(红色椭圆框中)的生意,丧失了核心地位
此消彼长。既然存储系统的硬件平台逐渐与服务器趋同,服务器厂商为什么还要找OEM代劳呢?纵使软件能力有欠缺,大厂也有更雄厚的财力,通过收购来补齐短板。Engenio现存的两大客户,Dell已经与EMC分手,IBM则以自家SVC(SAN Volume Controller)软件为核心,开发了可以替代DS5000系列(Engenio开发的DS4000接班者)的Storwize V7000,近半年来又推出了与DS3000系列市场定位重合的Storwize V3700/3500,抛弃Engenio只是时间问题。可能因为存储实力还不够,Dell与NetApp仍延续着较为紧密的OEM合作关系,但也是早晚的事。
简而言之,以软件为主导的发展方向,不仅让LSI无法体现优势,也促使其OEM客户选择自力更生。二者存其一,就够让LSI做出放弃的决定了,何况双管齐下?OEM是LSI多年来主要的业务模式,没有OEM要的产品,即使LSI想自己销售给用户,也不知道该怎么卖。Engenio并入NetApp之后,起码不存在这个问题。
有道是“关上一扇门,打开一扇窗。”服务器与存储走向融合,意味着LSI可以在服务器市场寻觅更多的机会。多端口数的SAS IC和扩展器(SAS Expander),使得服务器内部可以容纳的驱动器数量,大为增加。现在的2U机架式服务器,像IBM System x3650 M4和Dell PowerEdge R720这样的主流产品都能安装16个2.5英寸驱动器,而Dell PowerEdge R720xd和IBM System x3630 M4,更是可以配置多达26个2.5英寸驱动器,或者14个3.5英寸驱动器。
服务器内部要连接这么多的硬盘驱动器,对于RAID的要求高过以前,给LSI提供了更大的机会。LSI公司存储解决方案部门执行副总裁Phil Brace就自豪的表示,数得上的服务器OEM,只有惠普用的不是LSI的RAID方案(注:其实前一代产品还是,但现在HP的路线有分歧)。
LSI公司存储解决方案部门执行副总裁Phil Brace原任Intel公司担任服务器平台部市场总经理,2005年追随Ahbi加入LSI公司
站在存储系统的角度,服务器与存储融合,更“激进”的做法是,根本不用外部存储系统。既然每台服务器都可以接那么多硬盘,用大量的服务器做成分布式系统如Hadoop,还能满足数据尽量存储在服务器本地的要求。而这对LSI来说,相当于是个可以把存储系统“丢掉”的业务“抢”回来的机会。
互联网和大数据的兴起,使得像Amazon、Google、Facebook等互联网巨头,需要大量的服务器。他们的规模大到已经可以考虑自己定制服务器,更直接的向Intel、LSI等组件供应商采购,而无需传统的服务器厂商作为中间环节。一定程度上,他们对LSI这样的组件供应商,依赖度比传统服务器厂商更高。
如果说,对于Dell、HP、IBM等服务器大厂来说,存储业务也完全成了“自家的孩子”,手心手背都是肉。那么,起码Facebook不用考虑这个问题。如果LSI能帮Facebook简单高效的增强服务器的存储能力,他们才不在乎什么存储系统呢。
NetApp E2660就是原Engenio的高密度存储系统,NetApp的Hadoop开放解决方案(NetApp Open Solutionfor Hadoop)用E2660通过6Gb/s SAS直连多个数据节点(外部DAS),代替服务器内部的存储,可以提供更好的RAID保护、可维护性和存储利用率
不过,即便对希望把数据就近存储的HDFS来说,能够被几台服务器共享的外部存储仍然有利用率和灵活性等方面的优势。因此,作为折中方案,曾经被SAN“挤兑”多年的DAS(Direct Attached Storage,直连存储)焕发了第二春。SAS是个很好的直连技术(也可以小范围的使用交换机,这个不表),但典型的外部DAS仍是需要具备完整RAID功能的存储系统,而这个业务LSI已经随Engenio一同放弃。不过,LSI有办法——把DAS的RAID功能拿掉,变成JBOD的系统!
Facebook提出的Open Vault草案是Open Compute项目的一部分,能够在2U机架的空间里容纳30个3.5英寸硬盘驱动器,要用到4个28端口(可根据配置不同选择24或20端口)的LSI SAS扩展器。每个SAS扩展器上接出的一个x4外部Mini-SAS连接器可以用来连接一台或多台服务器,两个x4内部Mini-SAS扩展器用来级联其他的Open Vault存储单元。它看起来就像是把存储控制器拿出来放到服务器里(SAS RAID卡或HBA)的JBOD,可以抢一部分存储系统的生意(包括已属于NetApp的E-2600,如前一幅图)
所以,我们可以看到,在Facebook提出的Open Vault存储单元草案中,是4个来自LSI的SAS扩展器来完成把30个硬盘驱动器(考虑双端口)与服务器连在一起的任务。没有RAID,这就是一个JBOD。那么,服务器用什么与之相连?
HDFS可以把一份数据在不同地点(服务器、机柜、数据中心)保存三个副本,这样可以不用RAID,但需要具有较多外部端口的SAS HBA,这在HBA中属于高端产品;
大型的存储系统如EMC的Isilon或Atmos,因不能忍受大容量SATA硬盘驱动器漫长的RAID重建时间,选择擦除编码(erasure coding)作为替代。但就服务器内部,以及Open Vault存储单元这种虽有二三十个硬盘驱动器,却可能分属多个RAID卡的情况而言,RAID重建并非不可接受。为了提高存储空间的利用率,从Facebook到淘宝,都越来越认可RAID的价值。
无论SAS HBA还是RAID,LSI都是更占优势的那个供应商。
如果,一部分原来要通过存储系统才能满足的需求,现在用服务器就可以解决;那么,这个存储需求的“回流”,意味着随Engenio一同丢掉的,LSI可以从服务器市场补回来,甚至更多……?!