5月15日,2024春季火山引擎 FORCE 原动力大会的泛互联网专场圆满落幕。医渡科技 CTO、首席人工智能科学家闫峻博士应邀参加,并在“AI 和云驱动下的互联网新十年”泛互联网分论坛进行分享。
闫峻表示,医疗领域对数据的安全性和隐私性要求严苛,但 AI 技术,特别是大模型,在病历数据质控和结构化处理上展现了显著优势。AI 的应用不仅提高了数据处理效率,还为临床诊断、治疗及科研提供了新的辅助工具。即便如此,如何确保模型的高准确性、处理数据隐私问题以及实现商业价值化,仍是当前面临的主要挑战。这些挑战需要通过技术创新和合理的商业策略来克服,以实现 AI 在医疗领域的可持续发展。

医渡科技 CTO、首席人工智能科学家 闫峻
医渡科技自创立起便深耕医疗智能领域,致力于满足医疗行业需求,推动安全、普惠、价值驱动的智能医疗体系,凭借自主研发的“YiduCore”数据智能技术,对多源医疗数据进行深度处理,服务于医学研究、医疗管理、政策制定、药物研发及患者智能化疾病管理。面对医疗行业对大模型技术的迫切需求,医渡科技正积极布局,力求通过大模型技术助力医渡科技,实现 B 端和 C 端等多场景应用。
大模型应用落地复杂,能力与迭代速度成挑战
医疗场景对模型的准确性和可靠性有着严苛的要求,大模型在确保效果的同时,必须持续优化性能,以应对日益增长的医疗需求。由于医疗数据包含大量复杂且因人而异的病例信息,因此在训练大模型之前,需要对这些数据进行严谨的质量控制和结构化处理,这对大模型的应用链路保障构成了严峻挑战。同时医疗数据涉及用户隐私,大模型的应用过程必须严格遵循安全合规标准。基于医疗行业的硬性要求和公司现状,医渡科技明确了选择大模型的核心要求。
首先,从具备医疗行业基础知识和综合能力的基座大模型出发,医渡科技计划结合公司多年实践积累的知识图谱和医学知识,对大模型进行预训练和微调。在选择基座大模型时,其效果、预训练和微调接口的开放性,以及配套平台算力的可获得性,将成为首要考量因素,以确保模型能够充分满足医疗行业的专业需求。
其次,医渡科技高度重视模型训练和推理过程中的安全性,将训练数据、模型文件及推理过程中的输入输出视为核心资产。因此,公司期望构建一个安全可信的运行环境,以保障数据的完整性和保密性,防止任何形式的泄露或篡改。
最后,医渡科技还特别关注合作伙伴在大模型领域的战略投入是否坚定且长远,能否确保模型持续迭代和优化,以及是否具备技术实力来规划和发展模型的多模态能力,以适应医疗行业不断变化和日益增长的需求。
医疗大模型业务场景的探索作为创新业务,追求快速搭建和验证针对不同应用场景的技术组件,以确保业务高质量快速上线。同时,医渡科技期望与合作伙伴共享 C 端运营经验,共同探索用户增长和业务协同的机会。经过深度评测和横向对比,医渡科技认为火山引擎是满足这些需求的理想合作伙伴。
高效、经济的大模型,提供一站式服务
火山引擎与医渡科技在大模型、公有云、泛健康咨询及健康管理等领域已展开深度合作。借助火山引擎的豆包大模型及强大的训练和推理算力,医渡科技在火山方舟平台上成功进行了经过授权的专业医疗数据的深度训练和微调,显著提升了医疗领域的专业性。
火山引擎提供的全方位产品矩阵,涵盖计算、存储、网络、云原生及数据增长等多个方面,为医渡科技构建了一个从云基础到智能应用的完整技术支撑体系。为满足医渡科技的特定业务需求,火山引擎精心打造了高性价比的企业上云解决方案,该方案由30余款火山引擎系列产品组合而成,助力医渡科技迅速完成模型的云端部署,并确保业务在整个过程中的稳定运行。
针对医渡科技在持续业务场景探索与敏捷试错上的迫切需求,火山引擎精心提供了相匹配的产品解决方案,成功助力医渡科技在文档解析、音色复刻、数字人、用户增长、智能外呼、智能创作云等多个产品上实现了创新业务的迅速验证。此外,考虑到医渡科技在 C 端用户增长方面的特定需求,基于字节跳动深厚的用户运营增长经验,火山引擎构建了由大数据、用户增长和运营专家组成的专业团队,与医渡科技紧密携手,在抖音、扣子、豆包等字节生态内持续开展协同探索,为医渡科技的业务飞速发展和创新突破提供了坚实的支撑。
除了以上合作,医渡科技依托火山引擎的公有云服务和定制化的企业上云解决方案,迅速迭代并推出了开心健康小程序,已为江苏省惠民保用户提供服务。该小程序充分利用大模型能力,为公众提供泛健康咨询、导诊、用药指导、专病专题解析以及报告解读等全面功能。与通用大模型直接罗列可能性不同,医渡科技的医疗大模型具备智能追问能力,能够主动询问用户问题,通过多轮问诊精准收集诊断信息,从而给出更加准确和个性化的建议。
火山引擎作为字节跳动旗下的云服务平台,致力于成为推动数字化转型和智能化升级的有力引擎。未来,火山引擎将持续提升 AI 大模型、数据等多领域产品及方案能力,与医渡科技在医疗领域大模型应用落地方向深度合作,让公众健康从医疗 AI 科技进步中获得更多益处。
好文章,需要你的鼓励
PDF协会在欧洲会议上宣布,将在PDF规范中添加对JPEG XL图像格式的支持。尽管Chromium团队此前将该格式标记为过时,但此次纳入可能为JXL带来主流应用机会。PDF协会CTO表示,选择JPEG XL作为支持HDR内容的首选解决方案。该格式具备广色域、超高分辨率和多通道支持等优势,但目前仍缺乏广泛的浏览器支持。
华东理工大学团队开发了3DEditFormer系统和3DEditVerse数据集,首次实现了无需手工3D遮罩的高质量3D模型编辑。该技术通过双重引导注意力和时间自适应门控机制,让3D编辑变得像2D修图一样简单直观,在游戏开发、影视制作、AR/VR等领域具有广阔应用前景,标志着3D编辑技术向普及化迈出重要一步。
Ironclad OS项目正在开发一个新的类Unix操作系统内核,面向小型嵌入式系统,计划支持实时功能。该项目的独特之处在于采用Ada编程语言及其可形式化验证的SPARK子集进行开发,而非常见的C、C++或Rust语言。项目还包含运行在Ironclad内核上的完整操作系统Gloire,使用GNU工具构建以提供传统Unix兼容性。
上海AI实验室联合多所高校突破多模态AI训练难题,提出NaViL原生训练方法。通过预训练语言模型起点、混合专家架构和视觉-语言能力最佳平衡三大创新,在有限资源下实现与拼装式模型相当性能。该研究证明原生训练的可行性,为AI真正理解图文结合提供新思路,有望在教育、医疗等领域带来更自然的人机交互体验。