在广播、媒体、零售、地理信息系统等一些面临最严峻的数据存储挑战的行业里,很多企业不再将他们的数据称为“数据”,而是称其为“内容”、“资产”或“信息”。
这些企业认识到,他们的员工或客户可以利用这些数据信息来为企业创造价值,进而深入地去了解如何帮助企业增加收入、促进产品上市、赢得竞争优势、并且提高利润率。它表明存储不仅仅是支出,更能够赋能企业。目前业界对这一认识的支持率有不断增高的趋势。
昆腾的许多用户都属于此类思想领先的公司,以下是从他们的经验中吸取的一些重要经验:
经验之一:选择适合数据或信息“工作流”的存储系统:这是显而易见的道理,因为任何行业对数据的处理过程都是一个工作流的过程,例如数据的产生(采集)、编辑加工、再加工、分发结果等。在工作流中,数据不能丢失,还要能够在全球范围内将其分享,同时根据不同业务的需求还要能够帮助快速访问数据。 因此,工作流对存储有着特殊的需求。然而,许多公司却试图用通用型的存储去满足本来无法满足的特殊需求。例如,对于某大型零售公司,存放广告的视频和图像的存储竟然和存放大数据库和邮件用的是一样的存储。其实,我们应该为工作流选择适合它们特点的存储,根据工作流和用户的需求、针对每个数据类型来考虑并设计存储系统。
经验之二:将更多的数据存储更长的时间,使用户能够从数据中获得更多价值:例如,基因组测序的研究数据就是一个很好的案例,当前的研究完成后,有时候不能立刻知晓结果的价值如何。然而,几年后的研究可能会产生出更加重要的发现。这正是前期的数据是“具有不可预测价值的数据”的有力证据。 地理空间信息系统也是如此,当前捕获的卫星图像可能对10年后的任务或行动提供支持。由此可见,长期保留数据的价值是不可预测的。
分层存储系统是目前将更多的数据存储更长的时间的最优方法,也是最节约资金的一种方法。大多数数字内容都是“非结构化”的,是无法缩减或压缩的大文件,而且大多数此类内容需要保持可用性和可访问性。不过,它们可能在一段时间内,数天甚至数年都不会被访问。通常的正确做法是分层存储系统,即用加工时使用闪存存储-速度最快,而加工完毕长期保存时使用磁带这种成本低、功耗低的存储-速度够用、但成本最低。其他类型的存储如NAS、块存储、对象存储和云存储等也可以在大多数工作流中发挥作用。事实上,我们期望云计算在未来能够成为大多数分层存储工作流的一部分。
经验之三:用户首先要先能访问数据,然而才能从数据中发掘出价值:一些企业已经设计了基于数字资产工作流的存储系统,并且设计了支持其企业的分层存储系统来存储更多数据。 其下一步是确保最终使用者(电影剪辑师、设计师、营销管理者、科学家、分析师)可以在需要时无需通过IT部门就可以访问数据。因此,我们需要的存储必须是在全球范围内可以实现跨站点的共享的存储,并且是容易访问的存储。目前来说,LTFS磁带、基于对象的云存储技术、以及其他新的开放存储模式都可以帮助促进数据共享和快速访问。
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。