2023年10月26日,SAS用户大会之生命科学峰会在北京成功举办。本次峰会以“数据驱动 · 智能未来”为主题,以前瞻性和洞察力释放数据价值,为SAS用户提供了开阔及高效的合作交流平台。
本次峰会共汇集了近100位来自生命科学、医疗康健等行业的数据精英,围绕“人工智能及数据分析”在生命科学领域的最前沿技术及应用进行了深入探讨,为生命科学研发创新与转化、推动产业繁荣发展提供了有力支撑。
释放数据价值,共谋行业发展
2020年席卷全球的疫情,让人们重新审视了生命科学数字化转型的重要性。面对不断变化发展的监管环境,如何从海量数据中安全、高效、准确地汲取到关键信息,以更低成本实现更好结果,成为了摆在行业从业者面前的重要议题。
作为高级分析领域的领导者,SAS拥有丰富的经验和专业知识,可为生命健康组织提供大规模值得信赖的、先进的解决方案充分激发数据潜力,助力广大客户应对数字健康挑战,改善发现、开发、制造和商业化疗法的方式,并在临床研发、药品生产和供应链等领域为客户提供帮助,在高度监管的环境中更快地为患者提供更好、更安全的治疗。
针对生命科学数字化变革发展趋势,SAS全球技术业务副总裁Deepak Ramanathan在演讲中提到:“从成立之日起,SAS就致力于推动企业有效利用数据实现生产力提升。如今,生命科学行业正处于蓬勃发展的关键时期。面对未来竞争日益激烈的市场环境,SAS将持续创新推动生命科学领域技术突破,赋能生命科学行业未来健康成长。”
SAS全球技术业务副总裁Deepak Ramanathan
拥抱数字变革,赋能未来成长
众所周知,生命科学是学科高度交叉融合的典型学科。近年来,随着人工智能、大数据等数字技术的飞速发展,生命科学行业在临床诊断、精准治疗等方面迎来了发展的机遇与挑战,未来全新一轮科技革命将在生命科学领域全面展开。
SAS副总裁兼大中华区董事总经理何伟信先生说道:“举办此次峰会的初衷在于深度聚焦人工智能与数据分析在生命科学行业中的融合,助力数据分析人士、医疗行业精英实现技术与资源共享,拓展行业视野。如今,财富500强企业中的生命科学公司100%使用SAS,还有超过2350家各种规模的生命科学公司正在使用SAS。 这些行业的信任源自SAS深厚的行业专业知识和开放的生态系统,我们期待通过此次机会结交更多行业伙伴,更希望借助自身在数据分析领域的技术沉淀,帮助全面释放数据的重要价值,为广大客户提供更为高效的分析解决方案。”
长期以来,SAS一直是机器学习和自然语言处理领域的先驱。通过在软件中嵌入人工智能功能,SAS可以提供专门满足生命科学组织需求的、更加智能的解决方案。以在制药行业的应用为例,SAS的高级分析及人工智能功能可以助力保障药品安全、更加快速地将新疗法推向市场、更快更准确地发现生产中的问题,从而极大地改变治疗方法,帮助行业客户解决复杂难题。
生命科学领域与未来人类健康息息相关,利用数据驱动生命科学领域实现发展责任重大、意义深远。作为数据分析领域的推进者,SAS将持续聚焦数据分析前沿技术,与各企业和组织携手应对生命科学领域未来挑战,为生命科学行业加速推进数字化变革奠定牢固基础。
继在北京成功举办之后, 2023 SAS中国用户大会之生命科学峰会上海站将11月16日在上海嘉里大酒店隆重举行,欢迎行业伙伴莅临参与,共同探索生命科学行业数字化发展新景象。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。