近年来,数据安全事件频发,如果要在这些事件中找到一个关键词,那就是“数据泄露”。
7月3日,有用户在网上发帖称出售海量数据库,该用户提供的数据“样本”中,显示了多家公司的用户数据,其中疑似为某招聘网站的用户信息样本显示近30条含有个人姓名、性别、出生日期、地点、应聘岗位、薪酬预期以及个人联系方式的用户数据,引发热议。
6月21日,有微博网友曝料,某学习软件数据库信息疑似被公开售卖,其中疑似泄露的数据包含姓名、手机号、性别、学校、学号、邮箱等信息1亿7273万条。
时间再推回到2021年,Facebook出现大规模宕机,据传超过15亿Facebook用户的数据在一个流行的黑客论坛上出售。同年6月,知名职场社交软件也被曝出当时最大规模数据泄露事件,超7亿用户数据被挂在暗网出售。
一系列的数据、隐私泄露事件再次证明,在信息化和数字化飞速发展的今天,数据安全的保护是企业机构当下发展的重中之重。
神州数码云业务集团数据安全部技术总监徐元明对此表示,企业对安全的需求不是单纯的一个点,不能仅仅基于某个业务场景提供整个数据安全解决方案,数据安全防护要围绕数据整个生命周期系统性进行。
目前,神州数码正在从三个方面搭建数据安全治理的总体框架,一是建立依据国家法律、法规、行业监管标准及行业最佳实践等数据安全治理标准体系;二是围绕数据安全全生命周期做组织架构、管理流程的建设;三是基于数据使用场景提供相关技术手段和数据安全产品。
围绕数据安全全生命周期的防护,神州数码发布了数据安全管控平台,在数据采集、传输、存储、处理、共享、交换、销毁等一系列步骤中,可以通过各个子系统的能力的接入,保障数据安全能力的落地。在部署方面,以数据的分类、分级系统为基础,同时以数据的静态脱敏、动态脱敏、数据安全共享和数据审计的子系统,提供面向应用场景的解决方案,为用户提供可伸缩的、弹性的应用部署能力。
在数据安全全生命周期管理中,任何一环的缺失都会造成风险渗透。以数据的分类分级和权限管控为例,在许多数据泄露的事件中,企业不仅面临外部的盗取和攻击,同时面临内部管控失误失密的风险。神州数码的数据安全管控平台,通过统一集成,将技术、数据和业务进行了融合,最终实现的目标是统一的用户权限审批流通管理,统一的分布式集群部署架构资源管理,统一的分类分级清单的标准依据管理,统一的数据安全态势感知管理。尤其是数据安全态势感知,只有综合了所有数据使用场景和数据流转过程,才有可能在安全的角度来覆盖到企业的数据全生命周期管控过程,随后通过与业务更进一步地融合,为企业的数据安全治理带来更高的价值。
数据安全是企业数字化转型发展过程中面临的长期话题,《网络安全法》《数据安全法》《个人隐私保护法》等相关法律的施行,都在为企业敲响警钟,加强企业的数字安全意识,提升数字安全管理水平,最终决定着企业在数字时代的市场竞争力。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。