中科院张春明:利用第三代计算技术建立中国医药行业的“青藏高原”

2022年09月30日 19:45   21世纪经济报道 21财经APP   唐唯珂
张春明表示,在第一代技术时,生物科学家靠的是动物的细胞进行理想的生物学模型。这项技术支撑了当前的生物医药产业走到今天的繁荣,但是今天产业遇到的困境也恰恰是第一代技术的红利接近了尾声;第二代技术是数据生产和大规模观察技术。虽然高通量观察到一些东西,但所用到的洞见还是生物学模型所产生结构化的知识。

21世纪经济报道记者 唐唯珂 广州报道

9月29日,由南方财经全媒体集团指导,国内数字化智库型财经媒体领跑者《21世纪经济报道》、21世纪新健康研究院主办,广发证券联合主办的“2022中国大健康产业峰会之医药创新峰会暨“健康中国•21CC”优秀案例发布活动上,中科院计算所副研究员、中科计算技术西部研究院常务副院长张春明发表了“AI如何助力新药研发”主旨演讲。

张春明表示,目前数据对生命的“摄像”已经是工业化级别,即数据产生的质量高、速度快、成本低。对人和疾病的反映小到分子,大到组织和系统,包括整个人体,都可以做出数据的“摄像”。生命科学数据是真正的多维度、跨尺度大数据,将占据未来整个全世界数据1/3。但挑战在于从数据中挖掘规律、输出靶点等,进而服务疾病诊疗和医药创新。这些数据是我们可以挖掘的金矿,但数据从来不是石油,它是沙子,需要有很高超的提炼技术,才能把沙子中的金子提取出来。

张春明进一步表示,人生物医学知识和数据太复杂,专家看到的都是“大象”的一部分,希望能够进行系统的整合额挖掘,争取在不同分辨率上勾画出“大象”的全貌,例如如果是1K的分辨率,可能会促进10个IVD层面的诊断,但是当达到1W、1G分辨率的时候,那么向医药行业去释放的产能将更大。

AIDD2.0赋能药物研发各环节

张春明在演讲中指出,从上市公司角度来看,中国上市公司数量是美国1/3,市值是美国1/10,人群医疗消费水平是美国的1/20,所以中美之间差距明显。要缩短这一差距必须得想新办法。中国医药创新从仿制药发展到Me-too的过程,一开始是低风险高收益,经过几十年发展产生了一批药企,之后行业已经充分竞争,所以仿制药和Me-too阶段变成了低风险和低收益,国家医保包括政策导引开始加速行业向高风险、高收益阶段转移。

不过,张春明也指出,产生好的研发结果很难,做完分子上临床后成功率往往不到10%,做一个新药成本高达20亿美元。高失败率背后的原因,90%以上要归结于在对疾病和药物的机制不清楚,因此对疾病和药物机制的理解不清是整个制药行业需要解决的问题。 

药企目前也面临着低回报率的问题。此前德勤报告有统计,研发支出前12的大药企投资回报率已经低至1.8%,而且销售峰值在逐年的锐减。张春明认为,如果中国的药企再围绕传统的FIC(首创新药)思路去创新的话,将面临着当前的困局。所以各大药企想提高药物研发的效率,提高成功率,降低成本,就是必然的趋势。而AI技术能赋能整个行业的各个环节。

从上世纪90年代的CADD(信息驱动医疗中心)到现在的AIDD(AI辅助药物研发),药物的筛选和工艺的控制环节提高了效率和成功率,降低了成本。但是,在解决靶点发现和临床选择适应症和人群施准层面上的问题却没有解决。

张春明认为,必须要把AIDD发展到AIDD2.0,2020年是计算医学的元年,也是AIDD2.0的元年。其目的就是用AI去解决对疾病和药物机理认知不清的系统性问题,求助于超算、AI算法,包括多组学跨尺度的数据,从疾病的认知,靶点的产生、精准临床方案的设计,三个环节给行业起效加能,从根本上解决原创性问题。

张春明进一步指出,回过头看现在社会生产工具是否具备计算医学赋能的基础,其实整个科学和技术生态已经做好了准备,就像爱因斯坦当年做广义相对论,在100年前已经把数学工具准备好了。而算力现在是最快的生产工具,在70年内提升4亿倍,很荣幸我们是这个生产工具的弄潮儿,我们做出了世界上最快的超性能计算机。

将知识的孤岛变成知识的网络

同时,张春明也指出,生命医学的科学家发表了大概4000万篇文献,这就是知识的宝库。 张春明指出,要做医药创新,就要利用这些知识,站在巨人的肩膀上去面向未来。要从这些海量的数据里去挖掘知识,把知识的孤岛变成知识的网络,来服务医药创新,来服务早筛早诊。 

英国的UKbiobank(英国生物银行),已经在用国家的力量整合行业的资源造数据。

张春明指出,“从一开始用芯片的数据,到现在投钱去做药物研发,这些参与者不断地感知到不同的数据对他们的药物研发有绝对促进作用,所以药企才会出钱去做。”同时,张春明也指出,计算医学想要在整个行业广泛使用就必须做成APP,而APP是整个计算医学技术体系,有了这套体系后,就可以充分的利用行业化CIO的能力,以及中国丰富的病人资源和成熟的生物化学实验室,向行业做出一个差异化、高价值的资产输出。因此,要做行业的平台,向行业输出自己的IP。 

而想要顺利地输出IP,实现行业的进步,张春明表示还需要两个核心的技术。第一是超脑,要将这个行业呕心沥血的知识用在技术上,解决早筛的问题,将知识联络起来用于药物的研发和预防。

第二是从数据中挖掘规律。数据摄像是很容易的,但是识别相片里的信息是很难的。因此我们构建了一套创新性的方法,能够解决用小样本就可以解决药物发现和临床适应症的开发问题。

张春明指出,这套算法的核心是把一个人在1000个功能的指标上分解成一个数字人,将真实世界的病人直接用超算全部做成数字化病人库。拥有这套技术基础之后,再也不需要大规模的投钱收集数据和砸钱。只要在特定的癌种里去收集知识,多组学的数据。数字化人之后,再从环境、方方面面把人进行归类,用这种归类方式做靶点的发现以及老药的拓适应症。 

此外,张春明还表示,在第一代技术时,生物科学家靠的是动物的细胞进行理想的生物学模型。这项技术支撑了当前的生物医药产业走到今天的繁荣,但是今天产业遇到的困境也恰恰是第一代技术的红利接近了尾声;第二代技术是数据生产和大规模观察技术。虽然高通量观察到一些东西,但所用到的洞见还是生物学模型所产生结构化的知识。

张春明表示,前两代技术都是欧美的同伴们给行业做的贡献,我们想再超越它很难,但是第三代技术是最有机会引领的,而且是利用4000万篇文献和多组学的数据来建立行业的“珠穆朗玛峰”。“在青藏高原上随便长一个小山包都比泰山高,我们用这套技术来建立中国医药行业的青藏高原。 ”

(实习生唐菁阳对本文亦有贡献)

关注我们