每年被创建、采集或是复制的数据集合就是全球数据圈,2018至2025年全球数据圈将增长5倍以上。IDC预测,全球数据圈将从2018年的33ZB增至2025年的175ZB。
全球数据圈增长的主要驱动因素在世界各地基本保持一致,但各地的增长速度有所不同。娱乐数据和视频监控图像长期以来(并将继续)是全球数据圈的重要推动因素。然而,物联网(IoT)设备信号、元数据(对分析、情境化和人工智能至关重要)和生产力数据在当今日益数字化的世界中增长速度更快。
然而,相似之处之外,各地区还存在着微妙的差异。这些差异取决于某地区的消费者和企业的技术采用和数字化转型情况。
中国数据圈增速最为迅速,平均每年的增长速度比全球快3%。2018年,中国数据圈占全球数据圈的23.4%,即7.6ZB。预计到2025年将增至48.6ZB,占全球数据圈的27.8%,中国将成为全球最大的数据圈。与全球动态相似,中国数据圈将受到来自物联网设备信号、元数据、娱乐相关数据、云计算和边缘计算增长的驱动。越来越多的物联网设备在数据的创建位置处理并分析原始数据,以及建筑、桥梁、智慧城市等智能基础设施利用边缘设施和计算来赋能实时世界,在中国数据圈,边缘创建和复制的数据所占比例几乎翻了一番——占比将从数据总量的13%增加到23%。
更多关于IDC:2025年中国将拥有全球最大的数据圈报告的信息,请参考:https://www.seagate.com/files/www-content/our-story/trends/files/data-age-china-regional-idc.pdf?tdsourcetag=s_pcqq_aiomsg
好文章,需要你的鼓励
清华大学团队突破性开发"零样本量化"技术,让AI模型在不接触真实数据的情况下完成高效压缩,性能反超传统方法1.7%,为隐私保护时代的AI部署开辟新路径。
普林斯顿大学研究团队开发出"LLM经济学家"框架,首次让AI学会为虚拟社会制定税收政策。系统包含基于真实人口数据的工人AI和规划者AI两层,通过自然语言交互找到最优经济政策,甚至能模拟民主投票。实验显示AI制定的税收方案接近理论最优解,为AI参与社会治理提供了新路径。
K Prize是由Databricks和Perplexity联合创始人推出的AI编程挑战赛,首轮比赛结果显示,获胜者巴西工程师Eduardo Rocha de Andrade仅答对7.5%的题目就获得5万美元奖金。该测试基于GitHub真实问题,采用定时提交系统防止针对性训练,与SWE-Bench 75%的最高得分形成鲜明对比。创始人承诺向首个在该测试中得分超过90%的开源模型提供100万美元奖励。
南开大学研究团队提出了一种新的3D高斯泼溅重光照方法,通过在高斯原语上直接编码离散化SDF值,避免了传统方法需要额外SDF网络的问题。该方法设计了投影一致性损失来约束离散SDF样本,并采用球形初始化避免局部最优。实验表明,新方法在保持高质量重光照效果的同时,仅需现有方法20%的显存,显著提升了训练和渲染效率。