2014年8月19日中国国际大数据大会在北京国宾酒店举行。在大数据应用发展论坛上,国家统计局统计科学研究所副所长许亦频对政府统计应用大数据面临的主要障碍进行了详细的阐述。
许亦频
法律、法规与数据安全
随着大数据应用的不断深入,有关数据产权、数据公开和数据安全的法律、法规缺失很严重。同时大数据对隐私的窥探和暴露与大数据本身的特点是紧密相关的,这必然冲击现有的管理方式、社会秩序和法律体系。
在法律的层面上我国只有针对国家秘密的《国家保密法》,缺失针对个人隐私和商业秘密的专门法律。在专门的行政法规和部门规章的层面上,针对政府信息公开的条例及一些部门的法规如《统计法》。但是总体上来说约束力不足,尚且没有涉及商业秘密和个人隐私的专门法律。而关于数据采集、数据存储、数据所有和使用权责方面的法律也是空白,这些在宏观层面上直接关系到大数据的应用和大数据的数据安全。
数据公开性与数据标准
大数据应用开放的关键是打破数据孤岛,让数据互联互通,达成数据共享。但在实践中很多企业愿意将自己的数据纳入政府的统计体系或纳入政府的统计数据的发布体系。但是不太愿意提供数据的收集、方法和算法这些过程性的信息。但数据的权威性和数据的质量是建立在数据的公开性的基础之上的。目前看数据公开性的不足是制约政府统计应用大数据的主要障碍。
目前绝大多数大数据是以各种形式分散的存在于政府部门、电商企业、电信运营商和互联网公司,数据标准不统一、口径比较杂乱,数据间难以衔接,这也是限制大数据开发和共享的一个障碍。
信息发掘
很多企业无论国内还是国外在商用的数据发掘中取得了很多进展,出现了大量的成功案例。但是如何在国家治理和宏观管理中让大数据发挥作用,如何用大叔分析宏观经济形势,这些任务还有很长的路要走。在大数据信息挖掘中,强调相关性。在大数据挖掘的过程中存在一个现象即否认因果,但以国家统计局工作的实践,因果关系是不能忽略的。
当然在现实中发现相关性是很难的,认识的因果关系也不简单。而宏观层面上完美的大数据挖掘是高度性与合理性的结合。
好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。