要说当前高校的信息化热点是什么,各个高校的答案不一样,可无论答案是什么,利用信息化手段是他们共同的方式,尤其是利用云计算、大数据和移动互联网,帮助高校建设更好的信息系统,服务学生、老师和管理人员。
从当前趋势看,未来智慧校园的重点之一就是对数字资源的梳理和高效利用。简单来说就是存储问题。试想一下,高校数万名学生在同一时间点访问一个课件时会发生什么?可想而知,这不仅仅是网络的问题,还有访问权限、安全、共享等问题。
中国地质大学(武汉)(下简称地大)巧妙解决了这个问题,它是怎么做到的?
遇到这个问题时,地大的信息化已经发展到了一定程度。要说背景,地大是教育部直属、国土资源部共建的一所以地球系统科学为主体,应用科学、前沿科学,以及新兴交叉学科协调发展的全国重点大学;也是国家“211工程”、“985工程优势学科创新平台”重点建设,列入“111计划”和“卓越计划”;被誉为“中国地球科学的最高学府”。
而地大的信息化水平一直走在全国前列。按照中国地质大学网络与教育技术中心副主任张峰老师的说法,尽管同社会上的信息化水平相比,地大的建设可能会稍显落后;可是在教育领域相比较,地大在意识、建设规模上并不比其他高校落后;有些项目不是行业内第一,至少也是在同行中是率先应用的。
据悉,地大在1998年就启动了“数字地大”一期工程建设,自2008年起又开始启动“数字地大”二期工程建设,逐步建成了覆盖全校的网络化学习和工作环境,基于校园网的信息资源和应用系统建设不断完善,校园信息化建设走上了稳步发展的轨道。
在这里,简要说一下地大的信息化建设成果:
当前,地大已经完成服务器虚拟化和桌面虚拟化建设,完成二级扁平化无线网络的覆盖 ;大多业务系统均已建设实施;包含统一认证平台、数据交换中心、教务管理系统、学生工作管理系统、协同办公系统、科研系统等等。
要想解决“信息孤岛”的问题,还有一个统一的校内非结构化数据存储和共享的难题,不同于应用系统数据的问题是标准化,非结构化类数据最大的需求在于统一存储、管理和共享,汇聚包括业务应用系统文件图片资源、个人教学资料,最终面向用户提供教学资源共享和服务。张峰老师一直在观察和考虑解决方案,在三年前就开始接触爱数的工程师,并对AnyShare这个产品进行深入了解,根据地大信息中心的规划,提出了很多改进之处,最后共同研发出了AnyShare的产品解决方案。
地大遇到了什么样的问题?
最突出的问题是,大量资料散放在各个系统中(PC为主),如何利用这些资料成为难题,间接地,也对日后的系统建设带来一些麻烦。共享总不能依靠移动设备拷贝,同样,随着大量终端用户的出现,怎么让移动端更快速访问也是难题。
总结来看,地大的信息化系统需要将这些数字资源统一管理,同时能够与身份认证体系结合起来,又能做到对数字资源合理利用。举例说,某个系的课件只允许该系的学生和老师看,不能外传,也不用放在公众网上;这个课件需要加工和修改时,只有几名老师有权限。
客观说,地大的需求并不仅仅是统一存储的概念,也不仅仅面向对象存储的含义。它的需求更像是网盘:要将资源统一管理,能够编辑和处理。这是因为高校的这种业务性质所决定的,这和其他行业业务复杂性有关。
张老师说,之前也考虑过各种统一文件的管理平台,如金山的快盘、阿里的云盘等等,但这种基于公有云的网盘和私有云的网盘有很多的不同。最大的区别不是技术方面的,而是基于安全方面;尽管从技术来说,公有云的云盘可以杜绝信息泄密,但一旦泄密后果严重,毕竟高校有一些前沿的科技研究,承担着国家的科研任务。
同时,面向对象也不一样。面向公众的公有云网盘和面向有组织架构的私有云云盘的需求不一样,高校有类似公众的群体如学生和社会资源;也有紧耦合的组织架构关系,还有松耦合的院系之间的关系;这些关系就造成对网盘访问、权限的差异性。公有云的网盘很难解决这些技术问题。
因为见到过爱数在其他高校如清华、北大、西安电子科大等类似项目的成功,加上对爱数AnyShare的技术了解,地大与爱数的技术团队一起攻关,在技术上做了修改,算是量身定制了该文件统一管理系统。
这里稍微介绍一下这个系统。它的核心是以私有云存储的方式构建云共享中心,基于云存储集群架构满足大量用户在线的要求,并提供API服务。它位于数据管理基础设施的上层,这意味着不会搜集和抓取、整理数据,只是管理数据;它的上层是数据分析层或者是各类应用层,确保各类业务顺利展开。
这对地大来说太有用了。最重要的是解决了资源分散的问题,特别是针对高校的非结构化数据统一存储和共享管理,用户可以找到这些数据在哪里,而不像过去只是“模糊”的知道在哪里。因为非结构化数据的检索是最大问题。据悉,现在地大暂时使用600TB的存储空间,足够应对一两年之内的存储增长需求。
同时,资源统一管理之后,可与数字化校园系统整合,实现不同业务应用系统的统一非结构化数据归档和共享管理。也就是说,用户只管业务,不用管业务之下的数据存储问题:存在哪里,如何备份,是否安全等。
地大在导入身份认证体系之后,解决了高校有多种组织架构的问题,尤其是解决了权限的问题,确保云盘的数据安全。
张老师还演示了与高校虚拟桌面结合之后的效果。他在苹果手机打开系统之后,可进入Windows虚拟桌面,就可以像日常办公一样,对文件访问和处理。
“这套系统在细节上的亮点较多。”张老师说。
1.与现实的组织架构相匹配,实现文件的权限访问;
2.文件有不同的历史版本,可以回溯;
3.与业务系统的结合紧密。
比如高校内的期刊经常有约稿。现在可以把约好的稿件放在云盘中直接审稿和提出建议,作者再修改。再比如与OA系统的结合,用其负责资源的存储和调用,不用管OA流程,这都极大的促进OA的效率。还比如提供教师科研共享协作平台,比如未来与档案系统结合等。
“应用几个月之后,一开始还有一些小问题,但爱数的服务团队都很好的解决了。总体来说没有出现过较大问题,爱数的服务到位,技术也比较靠谱”张老师笑着说到。
他认为,要放眼未来的话,以后的高校必然会朝着智慧校园的趋势发展。在这个过程中,所有的业务都是对数字资源的应用;数字资源的存储与业务系统所剥离,业务系统尽可能的利用到数据分析、语义分析等数据分析功能,能够提高非结构化数据的检索能力和利用率。而进入智慧校园之后,那就是与物联网、移动密不可分,数据存储是基石。
看来,地大已经做好下一步的准备。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。