科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道密西根大学发布基于Google的数字化项目

密西根大学发布基于Google的数字化项目

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

密西根大学发布消息称将与Google和Isilon一起,完成一项为期六年,实现400TB书籍数字化存储的宏伟项目。

作者:存储时代/李泉(编译) 2008年4月9日

关键字: 集群 复制 RAID Isilon 数字化 ghost

  • 评论
  • 分享微博
  • 分享邮件
密西根大学发布消息称将与Google和Isilon一起,完成一项为期六年,实现400TB书籍数字化存储的宏伟项目。

这一“密西根数字化项目”(Michigan Digitization Project)将为该大学750万本书籍制作数字副本,并储存在Isilon提供的大型集群存储系统中。该所大学将把数字化内容与Google的图书搜索(Book Search)项目相连起来。

Google图书搜索项目于2006年启动,旨在为所有语言的各种书籍创建虚拟图书索引卡。图书搜索的设计与普通网页搜索类似,同时为不受版权限制的数字化旧版书籍提供链接。

密西根大学图书馆副馆长John Wilkin表示:“Google图书搜索的参与使得该项目变得尤其宏伟——与Google合作,我们能够实现数百万卷书籍的数字化,免去了爬遍书架翻找书籍的麻烦。”

Wilkin称Google会先扫描大学的藏书,然后把一份副本归还密西根大学,然后留一份副本供图书搜索使用。

每一本数字化图书文件大小约为55MB,下载速度为3Mbps,一周七天全天24小时均可下载。“没有Google的支持,我们永远做不到这点。” Wilkin表示,如果由大学负责扫描书籍,每年只能扫描约15000册图书。

为满足容量激增的数字数据,Wilkin和他的团队去年秋季采用了Isilon共计200TB容量的集群存储系统。32 IQ 9000和EX 9000两个系统分别设在密西根大学位于安娜堡的主数据中心和印第安纳州布鲁民顿市的灾备站点中,通过Isilon的SyncIQ复制软件相连。

“我们希望能将我们文化遗产的载体长久保留下来。”Wilkin说道,并表示图书馆的藏品中还有存世稀少的乔塞《坎特伯利故事》诗作以及二十世纪初期艺术藏品。

这位副馆长表示,Isilon提供的硬件取代了之前采用不同厂商RAID系统组合的方案。“这是一个整体规划——几百Tb的数据全放在一个地方储存的时候,必须确保优秀的存储管理,”他说道,“在过去,即使是我们最好的RAID系统,也总是不停出问题,经常让我们疲于奔命。”

Wolverines的RAID系统现在已经转移到该所大学IT基础设施的其他部位了,Wilkin已经开始考虑扩展Isilon的集群系统。

密西根大学及其研发合作伙伴印第安纳大学将在Big Ten大会上向其他学府推广这一数字化项目。“等更多图书馆加入了这个项目,累积下来的数据容量很可能会超过400TB。数据会持续增长,我们每年,或者每半年都要扩充其他东西。”

Wilkin对密西根大学与Isilon此次合作的合同价值不甚了解,但他估计密西根数字化项目的成本应在每年110万美元左右。“这只是硬件、站点和耗电成本,不包括人力和管理方面的费用。”

密西根大学并非目前唯一对存储技术采取积极措施的学府。位于休斯顿的莱斯大学(Rice University)今天宣布了一项合作协议,拟采用66TB的Isilon IQ-9000和IQ-200为其音乐学院和詹姆斯•贝克公共政策研究中心(James Baker Institute for Public Policy)的提供数字化存储。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章