微软公司称自身为全球最大的磁带存储用户,但希望拥有更快的替代方案以支持人工智能数据。
微软公司目前正在为其Azure云服务开发一类新的基于磁盘的存储方案,旨在为部分磁带运作速度缓慢的情况提供补充性支持。
Azure首席技术官Mark Russinovich日前在澳大利亚悉尼的一次会议当中表示,微软公司已经部署有磁带库为Azure归档服务提供支持,但表示“我们对此并不满意”。Russinovich展示了一张IBM TS3500磁带库的幻灯片,并表示“我们认为从存储成本与访问延迟的角度来看,磁带的成本其实并不算太低,但仍然比磁盘要好一点。”
他同时补充称,“我们之所以加大这方面的投资,是因为磁带驱动器相当昂贵,且需要在数据中心之内建立特殊的配套基础设施。”
微软的回应被称为Pelican项目,旨在提供一套装有1152块10 TB、3.5英寸磁盘的机架,其原始容量为11.5 PB。
Russinovich表示,Pelican在设计当中还包含数台服务器。“其独特之处在于,所有磁盘不会同时运转。在进行数据访问时,服务器将对各驱动器进行加速,从而以极低的功率存储海量数据。”此外,由于数据被存储在磁盘之上,因此其访问速度与磁带相比拥有明确的优势。
微软展示的Pelican项目幻灯片
根据Russinovich的介绍,Pelican项目更像是一种闲置磁盘阵列(简称MAID)。这项技术于2010年遭遇到困境,其主要推动者COPAN公司决定退出市场并接受SGI的收购。
新旧设备对比。
也许Pelican项目可以视为一种MAID的升级版本。当然,Russinovich没有明确表示Pelican项目的正式完成时间或者是否会得到全面采用。但他明确将其定位为微软公司现有云存储硬件的继承者。他同时表示Pelican与Azure Archive Storage非常适合为人工智能模型所必需的大量数据提供存储资源。Russinovich表示,目前企业一般不会广泛保留全部人工智能相关数据。微软公司希望能够凭借新项目与相关存储服务,鼓励客户坚持保留所有数据并付费实现永久保存。
此外,Russinovich还表示之所以推出Pelican项目,是因为一部分Azure数据中心还没有做好容纳磁带库的准备。在这样的情况下,Pelican这种基于磁盘的解决方案显然更具竞争力与可行性。
这位CTO并没有明确提到Azure未来会放弃磁带,因此IBM的存储团队暂时不必为此担心。但他确实指出,磁带存在着严重的局限性,而微软还需要另一种存储层。更重要的是,微软公司在尚未正式投入生产的情况下就已经全面讨论Pelican项目——这也许是受到了人工智能相关需求的推动。
Russinovich还指出,微软公司已经为部分Azure数据中心引入了实验性现场天然气发电机。发电机供电将用于支持基础设施的电池组,他表示其效率要高于直接使用当地电网的电力资源。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。