过大年吃饺子,元宵节放花灯,立春日剪春幡……中国历史悠久,民族众多,在悠悠五千年的历史中形成了丰富多彩的民俗文化。然而,在现代急剧变化的社会生活中,许多的传统民俗正不断地变迁,有些传统民俗甚至濒临消失。日前,希捷科技公司与北京大学社会学系合作,利用希捷行业领先的存储解决方案,帮助北京大学社会学系数字化保存中国民俗文化及非物质文化遗产资料。
北京大学社会学系是中国高校顶尖的社会学系之一,历史悠久,人才济济。 严复、蔡元培、李大钊、陶孟和、马寅初等中国知名学者都曾为社会学以及与社会学相关的一些课程在北大的发展做出巨大贡献。北京大学社会学系在从事社会学、人类学、民族学、民俗学等学科领域的研究时,十分重视资料的搜集工作。自建系以来,北京大学社会学系的专家学者们深入湘西 、陕北、晋中、贵州、黑龙江等地,在田野调查中收集了大量的与中国民俗礼仪、饮食文化、节日庆典、传统工艺相关的宝贵资料。
作为全球领先的硬盘及存储解决方案提供商,希捷科技公司非常重视中国传统文化的保护,并将其视为企业社会责任的一部分。希捷科技为北京大学社会学系提供了其全新的商业级4-盘位网络存储产品,帮助其实现资料的数字化存储。目前,借助希捷商业级网络存储产品,北京大学社会学系已经建立起一个庞大的中国民俗文化及非物质文化遗产数据库,其中包括长达1000小时的采访录音、200小时以上的视频、多达15万张的图片及30万字的文字资料等。
中国非物质文化遗产宁波金银彩绣(图片由北京大学社会学系提供)
中国非物质文化遗产朱金漆木雕(图片由北京大学社会学系提供)
“30多年来,我们承担了400余项调查研究课题,其中许多项目都与中国民俗及非物质文化遗产相关,我们师生因此累计了大量的宝贵资料,对数字化存储有着迫切的需求。”北京大学社会学系系主任谢立中表示:“希捷提供的这款容量高达4TB的商业级网络存储产品上,帮助我们实现了资料的集中存储,为我们建立中国民俗及非物质文化遗产数据库提供了便利。”
希捷商业级4-盘位网络存储是一套完备的网络存储解决方案,旨在通过创建安全的私有云,使最多 50 名雇员的企业保持卓越的生产力。多年来,由于缺乏先进的存储设备,北京大学社会学系的工作人员只能将田野调查中获得的大量的录音、录像、照片等资料散存在各自的电脑设备中,在数据查找与分享时存在诸多不便。凭借多种容量级别和易于配置的备份选项,希捷商业存储“4-盘位”网络存储产品将北京大学社会学系收集的关键数据集中于单个设备,实现数据的集中备份和保护,为北京大学社会学系的工作人员开展协作创造一个共享空间。
此外,希捷商业级4-盘位网络存储产品特有一个 Web 界面,北京大学社会学系的工作人员可以在该界面上安全下载和上传大文件。与一般的云存储服务不同的是,用户对自己的数据拥有完全的所有权和控制。而且,希捷商业级网络存储产品的设置和使用也极为简单,无需聘用 IT 专业人员。
北京大学社会学工作人员使用希捷商业级4-盘位网络存储产品
存储收集的资料(图片由北京大学社会学系提供)
除希捷商业存储4-盘位网络存储产品外,希捷科技还为北京大学社会学系提供了希捷无线硬盘,帮助专家学者深入民间,采集民俗文化及非物质文化遗产资料。北京大学社会学系专家曾携带希捷无线硬盘走访湘西 、陕北、晋中等地,完成了 “非物质文化遗产保护与文化生态建设”、“晋中国家级文化生态保护区规划”、“陕北国家级文化生态保护区规划” 、赫哲族“伊玛堪”的社区保护研究、“湘西凤凰声音民族志研究”等多项中国民俗及非物质文化遗产研究项目。
“希捷无线硬盘小巧便携,并且容量非常大。在田野调查时,我们可以及时地将收集的资料保存到希捷无线硬盘上。” 北京大学社会学系“非物质文化遗产保护与文化生态建设”项目负责人高丙中教授表示:“更重要的是,我们的团队成员可以通过各自的智能手机或平板电脑,随时连接希捷无线硬盘,共享资料。”
“中华民族创造了丰富多彩、弥足珍贵的文化遗产。” 希捷科技全球副总裁暨中国区总裁孙丹女士表示:“我们非常荣幸能与北京大学社会学系合作,利用自身行业领先的存储技术,数字化存储中国民俗文化及助力非物质遗产学术研究。”
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。