Scality正在开发一款软件定义存储控制器(SDS)以实现对象存储转移到公有云或者使用S3协议的磁带上。
这个想法是要利用策略从本地的Scality RING存储系统中选择那些传送到S3目标的对象。关于这些对象的元数据可以保留在本地以辅助搜索。可以强制实施策略,这样对象就可以保留在地理区域或者国家范围内以符合国家数据存储要求。
我们知道,Scality将支持从S3向Amazon云的转移,用多云方法也可以转移到Google中。Azure也在目标云的支持名单中,但却没有IBM的Bluemix。该S3协议还给磁带环境提供了SpectraLogic的Black Pearl,作为磁带向前传输的潜在目标。
Scality希望用户可以免费使用这个S3访问协议,并开放了它的源代码。最近上任的CMO Paul Turner表示,自从推出以来已经有超过8000次下载,目前每周的下载量是500。
他认为对象存储市场已经发展成熟,达到一个只有那些拥有足够多客户、具有一定规模的企业可以实现增长的阶段,他还提到了最近Gartner公布的分布式系统和对象存储系统魔力象限。Turner认为,这最好是命名为内容存储魔力象限,两个基本技术选择是横向扩展文件系统和对象存储。
很多对象存储厂商并没有入围Gartner的这个魔力象限,他认为这标志着很多厂商正在与实力较弱的厂商进行整合——但他说他的公司不会的。
即将推出的Scality SDS技术类似于昆腾现有的StorNext和Cloudian的对象存储产品。StorNext可以将非结构化数据分层到磁带库或者Lattus对象存储(实际上是OEM自西数HGST部门的Amplidata软件)。
Cloudian最近宣布,他们的HyperStore可以将对象分层到Google的Coldline中。
显然这些厂商看到了大量非结构化数据——例如互联网生成的各种数据——正在从旧的、低延迟的对象存储转移到更廉价的、归档级的存储中,这是有道理的。
我们可以想象,Scality的合作伙伴例如HPE也会采取这种策略。
注:过去Turner曾表示,他认为当每TB成本降下来的时候,廉价的、高容量的闪存存储很适合对象存储软件。也许明年年底我们会看见低成本版本的西数/SanDisk Intelliflash推出吧。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。