2024年1月29日,波形智能(AIWaves)于杭州举办首个技术开放日(AIWaves DevDay),正式发布新一代自主研发的中文内容创作垂域SOTA大模型「Weaver」,及由其驱动的面向用户写作类Agent产品「蛙蛙写作1.0」。同时,波形智能面向企业的定制服务「AIGC解决方案平台」也迎来全面升级。

图1:波形智能技术开放日现场
Weaver是波形智能自主研发的首个中文创作大模型,在小说创作、营销文案设计、短视频脚本撰写、游戏NPC塑造等中文内容创作领域上皆击败了GPT-4、文心一言等国内外通用大语言模型。
波形智能创始人兼CEO姜昱辰表示:“从波形智能成立之初,到今天正式发布产业化研究成果,我们的目标一直都很明确,要开发人人都能用得上的AI产品,让所有人都能拥有内容创作的能力。”姜昱辰坦言,“尽管这很艰难,但我们从未怀疑,也从未停下脚步,今天终于迎来了Weaver的诞生。内容创作时代范式正在转变,我相信2024年将是大模型大展身手的一年。”
波形智能联合战略合作伙伴APUS和浙江大学,共同研发了Weaver大模型,未来,波形智能将与更多合作伙伴携手,基于AI Agent框架继续开展下一步研究工作。目前,波形智能已获得由蓝驰创投领投,西湖科创投、老股东藕舫天使等跟投的Pre-A轮融资。
中文创作能力全面跃升 构筑Weaver垂域大模型核心壁垒
面对大模型技术在AIGC领域带来的机遇和挑战,波形智能积极探索内容创作垂域大模型的研发和应用,从0到1搭建了Weaver大模型全套框架。本次技术开放日是Weaver大模型首次公开亮相。
作为国内为数不多的拥有从模型层到应用层全技术栈能力的人工智能企业,波形智能基于自研RecurrentGPT长文本生成技术和Agents框架,不断打磨底层模型与基础框架能力,构筑了Weaver大模型的核心壁垒。
姜昱辰认为Weaver的最大优势就是专注做好写作这一件事,以六大核心功能,构筑垂域竞争力:一是,它聚焦超过30个行业领域的10类写作任务,通过百万量级指令及领先的LLM指令微调技术,深耕文本创作垂域,让它什么题材都能写、什么风格都会写;二是,基于全新自研自动标注系统(instruction backtranslation)和对齐技术(constitutional DPO)形成更自然真实的写作文风;三是,支持个性化知识库,让AI“越写越懂你”;四是,原生支持函数调用(function calling),使得Weaver的Agent能力大幅增强,应对文件处理、数据分析、图表绘制等各种复杂任务游刃有余;五是,Weaver大模型文本生成速度快;六是,长文本和结构化文本生成能力强。

图2:波形智能创始人兼CEO姜昱辰
目前,Weaver提供Mini(1.8B)、Base (6B)、Pro (14B) 和 Ultra (34B) 四个不同型号,分别适用不同的创作场景。根据任务复杂度,不同型号的模型可由波形智能自主研发的路由Agent (Routing Agent) 动态调度,平衡响应质量和计算成本。
波形智能CTO周王春澍表示:“当与其他通用大模型对比时,Weaver在各项评估创作能力的数据集基准上,能表现出比其大数倍的通用大模型更优的效果。而我们目前最强大的Weaver Ultra模型在多个写作场景中的表现甚至超过了GPT-4。这就是我们专注于为创作而训练的垂类大模型的优势。”

图3:波形智能CTO周王春澍
B端、C端齐落地 继续向深度业务服务场景挺进
为了更直观地展示Weaver大模型的各项功能和易用性,波形智能在技术开放日现场同步发布了Weaver驱动的AI辅助创作工具「蛙蛙写作1.0」。
波形智能CPO万磊表示:“「蛙蛙写作1.0」是波形智能为专业小说作者、自媒体运营者、各行各业的内容生产者提供的一款效率工具,能有效帮助C端用户提升他们的写作速度,优化创作模式,还为每一个创作者提供自己专属的个人知识库工具,并且可以随时被AI工具调用。 相比于其他同类型工具,蛙蛙写作在写作垂域的生成效果较GPT-4、文心一言等同类产品更胜一筹。蛙蛙写作借助Weaver大模型的技术优势,利用个性化知识库、模块化长文本写作模式等原生功能,帮助文本创作者突破内容生产力瓶颈。”

图4:波形智能CPO万磊
而面向开发者和B端用户,波形智能开放了大模型API调用,允许通过API将Weaver集成至第三方应用程序和服务中,以此对波形智能企业级一对一定制化平台「AIGC解决方案平台」的服务能力进行全面升级。企业可以通过调用API、或联系定制自己的专属模型,实现例如AI医生、AI咨询师、AI导购员等文本对话功能,一键实现对业务系统的赋能。
深圳市布尔量科技有限公司是波形智能「AIGC解决方案平台」的早期用户之一,创始人兼CEO王庆表示:“布尔量科技尝试过非常多国内的模型,但是大部分都不能在创意写作领域有较好的表现。但波形智能的模型,不管是在营销文案生成还是软文写作上,我们都非常满意,实打实解决了我们大模型落地的最后一公里。”
目前,波形智能正处于实现底层能力与服务初步产品化的阶段,未来将持续打通C端和B端产品功能,加速实现向“AI自主拆分任务、选择工具、完成绝大多数工作、用户只负责设定目标和监督”的全流程路径升级迭代。
“AI就像蒸汽机一样,它的到来意味着一场人类生产力的革命。”姜昱辰表示,“波形智能的短期目标是开发AI Agent,更好地帮助生产者进行内容创作。而当AI技术被应用到人类社会的方方面面时,作为AI技术开发商,波形智能的终极使命,则是让人类生活变得更美好。”
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。