扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共6页)
Internet Archive
存储概况:非赢利性组织仿效Google管理自己的存储网络
核心供应商:Capricorn Technologies
这家位于旧金山的组织需要存储的网页数据量简直是个天文数字,这是一项令人难以置信的任务,需要超乎寻常的存储架构。
Internet Archive的创始人Brewster Kahle表示,“我们也正在对几十万的图书资料进行电子化。”他还表示该机构正在考虑存储音乐和视频数据。
“其他一些的公司业务也达到了这样的规模——Google和hotmail应用都是如此,但据我所知,没有更多的公司涉足这一领域。”
和Google公司一样,Internet Archive也使用了数以千计的Linux机器。
Internet Archive成立于1996年,该组织本质上是一个巨大的数据仓库,目前在该组织的存储网络中存放的数据超过了2PB。该网络由大约2,000台来自Capricorn Technologies的Linux机器组成,它们通过以太网连接在一起,每台机器都提供了大约4TB的容量。
这些被称为“Petaboxes”的设备让Internet Archive能够在不耗尽资源的前提下,扩大运营规模。Kahle表示:“它成本低廉、维护简便、能耗低、密度高。”
存档的网页数据可以通过互联网访问,访问需要通过一个被称为“Wayback”的门户,这个门户是由Kahle和他的团队建设的。这个名字让人联想到上个世纪60年代的动画片《飞鼠洛基冒险记》中的片段。
谈到Archive未来的存储需求的时候,Kahle对Byte and Switch表示,他正在考虑Sun最近推出的Project Blackbox,这是一个移动数据中心,可以用集装箱将其运送到客户指定的地点。
他表示,“这是我所见过的最了不起的进步,对于业务规模和Internet Archive差不多的人来说,这也许会非常有趣。”“你可以把3PB的数据存放到移动的集装箱里。我们认为这种做法非常有竞争力。”
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。