中国科学院院士陈润生:医学数据成为大模型成长的“养料”
文|TWYMG2024年7月10日,高晓松参加了LV在北京798艺术区举办的时尚活动。在这次活动中,高晓松身着黑色风衣外套搭配黑色长裤,留着短发,戴着黑框眼镜,整个人看上去比以前消瘦了不少,也显得更加年轻。
11月1日,2024四川网信“数智领航”第十四期川网联“走进新质生产力前沿”系列活动暨第十届生物医学大数据·智能技术会议在成都举行。会上,中国科学院院士、中国科学院生物物理研究所研究员陈润生接受了封面新闻记者的专访。
\n\t\t\t\t\t\t\t中国科学院院士、中国科学院生物物理研究所研究员陈润生\n\t\t\t\t\t\t\t
陈润生是我国最早从事理论生物学和生物信息学研究的科研人员之一,是以基因组为研究对象进行生物信息学研究的先行者。此次采访中,他阐述了自己对人工智能与生物信息的深度思考与见解。
AI在生物医药的应用还在早期阶段
人工智能大模型和生物医学大数据之间的渊源已久。陈润生提到,人工智能最早应用在医疗领域的是病案管理,基本信息的记录包括电子病历的管理,这些流程都实现了自动化。“人工智能不仅仅是让医疗管理更方便,实际上整个过程中也在积累多层次大数据,这些内容可以分析出一些规律。比如过去一个新药的发现,往往要筛选上万个点,用十年时间投资10亿美金,现在用了大模型可以大大缩减流程。”
陈润生看到,特别是今年很多奖项,包括诺贝尔物理学奖、化学奖,都授予了人工智能大模型领域,他认为这是极端少见的,所以可以充分体会到大模型的震撼和深远的社会影响。
那么大模型到底对社会带来了哪些变革?陈润生认为最典型的两点是 了自然语言的处理和实现了多模态的融合。“比如我们生物医学用的组学大数据,包括基因组、转录组、蛋白组、代谢组、表观组,再加上医学当中各种各样的生理生化指标,包括心电、脑电和影像学资料,每一个的基本标准都不一样,怎么融合?从现在看来建模是不现实的,大模型给我们提出了一个 好的场所。”
但总的来说,陈润生认为大模型在各个行业的应用还需要一个漫长的路程,目前AI在生物医药的应用还处在早期阶段。
构造专业大模型是一条更敏捷的路
当下,大模型成为兵家必争之地。但是大模型怎么构造?陈润生指出了一条“更敏捷的路”。
他提到,因普适大模型建造成本 高,所以更好的办法是建造一个行业大模型。“选择一个在国际上公开发表的并合适的足够前沿的大模型,把它拷贝过来作为大模型的基底,保证你的大模型具有国际水平。然后把你自己收集的数据,建立的技术方法,加载到这个基底上,就建成了具有国际水平又有自身特色的行业大模型,实际行业大模型还可以分层再细化。”
那么在行业大模型的发展中还有哪些问题急需 ?陈润生告诉记者,一个是数据的标准化,另一个是数据的整合。他指出,行业内的很多数据标准化不同,此外很多数据不透明,数据整合是应用者的诉求也是管理部门需要协调的。实际上,依靠医学数据,能够让大模型发挥更好的作用。
“面向未来的发展中,大模型并不仅仅是提供了一个辅助工具,更重要的是大模型出现了所谓的涌现、顿悟和幻觉。”陈润生表示,当大模型系统达到一定程度之后,它会产生新的智能,人工智能能否超过人类智能?这又成为一个深刻的科学问题。
封面新闻记者 朱珠
【如果您有新闻线索,欢迎向我们报料,一经采纳有费用酬谢。报料微信关注:ihxd ,报料QQ:3386405712】