5月17日,由小鱼易连和高思教育共同发起的"蓝天下,同课堂--肩膀计划&双师课堂发布会"在北京千禧大酒店成功举办,全球范围内超过400家教育行业从业者参与本次会议。
发布会开场,小鱼易连董事长兼CEO袁文辉分享了一则真实的故事:"在四川省达州市村坪村小学,80%的学生是留守儿童。学校只有三个班级以及三位老师,每位老师负责整个班级的所有课程。平均每一个学期,这里的老师都会离开。每个新学期,孩子们都会问:"我的数学老师去哪里了?"
而就在上个月,小鱼易连带着"云+端"的双师课堂解决方案走进了村坪村小学,一堂别开生面的双师课堂在这个乡村小学顺利的开课。一张张灿烂的笑脸,一双双求知的眸子,让在座的与会者潸然泪下。为孩子们的求知而感动,为远端的老师与孩子们直接的课堂互动而兴奋。
当前的教育扶贫正在从物资扶贫进入到资源扶贫的全新的阶段。肩膀计划利用小鱼易连"云+AI"技术推进教育信息化变革,同时整合优秀教育资源,真正实现了连接中国百万优秀教师以及千万贫困地区学龄儿童。
袁文辉同时发布肩膀计划整体进度规划:2018年9月完成6间双师课堂部署;12月完成100间双师课堂部署;三年内完成900间双师课堂部署。在课程的选择方面,肩膀计划不仅覆盖K12阶段语文、数学、英语等主科课程,还将覆盖音乐、美术、心理学、生活常识、科技等等多样化课程,丰富孩子们的知识面的同时,解决留守学生的心理问题。
鸿基金、创新工场、鸿合科技作为肩膀计划的联合发起方,将承载资金支持、贫困地区学校资源提供以及双师课堂所需的设备支持。
创新工场创始人李开复以及央视著名主持人、鸿基金发起人陈伟鸿出席了本次会议。发布会上,李开复表示:"创新工场作为肩膀计划的联合发起方,看中的是肩膀计划的核心主旨。在过去两年里,小鱼易连在音视频方向探索取得的成绩,加之整合优秀教育资源的能力,我相信肩膀计划是改变教育资源不均衡的有力尝试"。陈伟鸿表示:"鸿基金将为肩膀计划持续提供教育资源匮乏地区的学校,旨在为这些地区引入最优秀的教育资源方。"
肩膀计划作为资源型的助学计划,它的背后有一整套远程双师课堂技术解决方案作为支撑。小鱼易连是全球唯一一家实现远场音视频云识别的解决方案提供商,通过远场音视频云识别能力保障双师课堂生动流畅的效果;同时动态调整不同网络带宽下音视频质量,依靠核心音视频算法保障授课、听课端教室在互联网丢包环境下顺利上课;标准化的统一部署方案保障大规模的方案复制。
小鱼易连同时融合教育场景需求,实现课前预约、课堂互动、课中管理、课后点播、考评等功能。值得一提的是利用AI技术,做到身份识别、行为识别以及课后数据分析。通过人脸识别,课堂点名不再有假李逵冒充上课;通过身份识别,学生们的姓名、考试成绩等信息,统统都会出现在授课端老师面前;通过行为识别,远程老师第一时间知道哪个学生打瞌睡、上课走神;通过课堂中学生们行为识别以及学生使用答题器答题情况统计,老师判断课堂效果,包括学生的专注程度、参与程度、知识点的掌握程度等。当出现大面积数据异常时,老师可以及时调整教学方法。相比采用直播+答题器模式的双师课堂,小鱼易连双师课堂解决方案超越了整整一个时代。
小鱼易连董事长兼CEO袁文辉在会后采访时激动的表示:"孩子,是国家的种子,是中国的希望。目前,困扰教育的关键问题已不再是财政投入不足,而在于优质教育资源配置的不均衡。移动互联网、人工智能和大数据的发展,提供了优质教学资源结构化、以学定教、个性化教学的可能性。星星之火,可以燎原。肩膀计划虽然还很渺小,力量有限。唤醒以及改变,让更多的人知道肩膀计划,加入肩膀计划,改变中国教育资源不均衡局面是肩膀计划的初心。"
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。