世界生命科学格局中的中国

发布时间:2022-05-19 09:11:26  |  来源:中国网·中国发展门户网  |  作者:张先恩  |  责任编辑:刘梦雅

中国网/中国发展门户网讯 生命科学是研究生命本质及运行规律的自然科学,且与人类健康息息相关。本文试图从宏观层面,概略生命科学发展历程,归纳当代生命科学发展特征和前沿热点方向,分析中国在世界生命科学格局中的地位,举例介绍近10年来的代表性成果,讨论未来发展中需要关注和解决的问题。

生命科学百年发展趋势概略:3个“50年”

生命科学近150多年发展史中大约每半个世纪出现1次地标性突破(图1),并形成3个发展阶段。19世纪中叶,孟德尔通过种植豌豆实验发现遗传学基本规律并提出遗传因子假说(1865年),50多年后,摩尔根通过果蝇研究将遗传因子定位在染色体(1910年),他们共同奠基了经典遗传学,为第1个阶段。20世纪中叶,沃森和克里克发现了DNA双螺旋结构(1953年),开启了分子遗传学和分子生物学时代,为第2个阶段。此间,发现了生命遗传学密码和DNA-RNA-蛋白质生命科学中心法则,并催生了惠及人类的基因生物技术。20世纪和21世纪之交,随着“人类基因组计划”的实施和完成,生命科学进入组学和系统生物学时代,开启了第3个阶段。大量复杂的生命过程和疾病机制被阐明,基因组测序、合成与编辑,以及与人工智能的结合,正在谱写基因组的“读-编-写”新篇章,科学家开始书写合成生命体、精准调控生命过程。

上述3个阶段也是环环相扣的3轮生命科学革命,其标志是生命科学研究范式发生深刻变化,从生物表观性状及遗传的观察描述到生命过程的分子生物学表征与关联,再到以组学为特征的系统生物学运用,广泛影响生命科学研究各领域,并引领医学、农业生物学等领域及其技术的全面进步,极大地贡献了人类健康和经济社会发展。

当代生命科学特征

在新科技革命驱动下,生命科学呈现以下5个特征。

原始发现层出不穷,底层创新呈现井喷。分子细胞生物学已经渗入生命科学的整个学科体系,成为生命科学各基础学科和应用学科的基础和支柱,促进层出不穷的原始性发现和底层创新。例如,强大的基因编辑技术源于微生物和古菌进化出对付病毒(噬菌体)感染的适应性免疫分子机制CRISPR的发现;改变分子生物学面貌的聚合酶链式反应(PCR)技术源于极端微生物细胞中耐热DNA多聚酶的发现,免疫检查点(CTLA-4和PD-1)的发现和细胞免疫学研究导致了如火如荼的肿瘤靶向免疫治疗,正在颠覆传统的癌症治疗模式;RNA干扰(RNAi)机制的发现,启动了遗传病基因沉默的治疗路线;细胞凋亡(apoptosis)、细胞焦亡(pyroptosis)、细胞程序性坏死(necroptosis)、

细胞自噬(authophagy)、细胞铁死亡(ferroptosis)、

细胞组分相变(transition)等现象被发现,叙述着细胞在生理、病理过程中种种巧妙的自调节机制,并衍生出重大疾病治疗的新策略。

系统论与还原论并重,层层揭秘复杂生命过程。分子生物学成功地注释了大量功能基因,并将许多生命过程和疾病发生机制与相关功能基因及转录和表达产物联系起来,若将此称为“还原论”,以基因组学、转录组学、蛋白组学和代谢组学等构成的生命组学,则是对复杂生命网络体系的系统性认识。“自下而上”与“自上而下”的结合,极大地提升了生命科学中发现的机会,催生了一个又一个新的研究方向和前沿热点。例如:整合基因组学、疾病分子生物学基础和临床数据,促进实现精准医学及个体化治疗目标;人体微生物组及代谢组被发现与健康和许多疾病息息相关,“肠道微生物组及代谢组也为解释中医药原理提供了一个新的视角”;通过基因组学和转录组研究及基因功能注释,发现仅有2%基因组编码蛋白质,其余98%功能未知部分被类比为基因组中的“暗物质”。其中,大量非编码RNA被发现在细胞网络时空调控中发挥关键作用,这“为生物学开辟了一个全新的领域,……在未来的后续研究中具有无限的潜力”。 

学科汇聚融合,生命科学研究从定性描述开始实现动态、精准和定量解读。生命系统的遗传变异、代谢及调控的时空动态变化和生命物质的柔性等决定了生命过程的复杂性,目前所积累的生命科学系统知识多是大量定性片段结果的集成。超分辨显微成像、冷冻电镜、流式质谱、质谱成像、磁共振成像、增强拉曼光谱、膜片钳、光镊、纳米孔测序、纳米与分子生物传感、全微分析系统(mTAS)及器官芯片(organ-on-a-chip)、3D生物打印等各种物理和化学方法及技术平台的创建和应用,为生命科学研究提供了越来越强有力的工具,从而实现单细胞、可视化、高通量、高时空分辨分析和操纵。已经获得高分辨脑图谱、单细胞转录组、单细胞蛋白组、胚胎细胞谱系、活细胞中蛋白质3D结构测定、单粒子病毒在活细胞中的示踪、芯片上多器官互作及类器官创建等。生命系统得以在微观层面被精准、定量、可视化表征,甚至被成功模拟。

科学数据共享,成为生命科学界普遍遵循的规则。以基因数据库和蛋白质结构数据库为核心的各类生命科学数据库在现代生命科学研究中发挥巨大作用。数据库建设者与科学共同体形成一个准则:研究人员在使用数据库的同时,将自己研究发现的(基因序列或蛋白质结构)数据存放到数据库中,因而同时成为数据库的使用者和贡献者。如今,数据库已经成为生命史书最可靠的纪录载体和强大的数据分析平台,为整个生命科学研究所依赖。例如,新冠肺炎疫情全球大流行至今,新冠病毒基因组序列数据已经超过1000万条。这些数据通过全球共享流感数据倡议组织(GISAID)、中国国家基因组科学数据中心(CNCB)、美国国家生物技术信息中心(NCBI)和欧洲生物信息研究所(EBI)等共同实时发布,为新冠病毒病原生物学和分子流行病学研究、检测技术建立、药物和疫苗的研发提供依据,在全球科技抗疫中发挥了重大作用。

合成生物学与人工智能(AI)兴起,为生命科学研究提供了新的范式。①合成生物学兴起与21世纪同步,它汇聚生命科学、物理学、化学、材料科学、计算机与信息科学,并结合工程学理念和自动化技术,对生物体进行再设计与合成。其“自下而上”的模式,从表征天然生物大分子,使之成为标准化“元件”,到创建“模块”和“线路”等生物部件和细胞“底盘”,来构建预期的人造生命系统,研究生命的底层规律。这一理念,将我们习以为常的“格物致知”研究策略,推进到了“建物致知”的新高度。然而,鉴于生物体系的复杂性,目前生物体系的理性设计还依赖于高通量的“试错”实验,由此出现了“生物铸造工厂”(Biofoundary),即生物设计与合成自动化设施。也基于此,合成生物学的另一理念“造物致用”,正在催生未来生物技术。② AI基于大数据、算法和机器学习,应用于生命科学中最典型的例子是对蛋白质3D结构的预测。长期以来,蛋白质结构预测进展十分缓慢。对于一个未知结构的蛋白质,若没有其同源蛋白质的结构,则需要通过实验来测定其结构信息。谷歌公司DeepMind团队的AlphaFold在两年一届的“蛋白质结构预测技术的关键测试”(CASP)中脱颖而出之后,该团队于2021年在Nature上分享了AlphaFold2开源代码。与此同时,美国华盛顿大学等团队也在Science上公布了新的深度学习工具RoseTTAFold。接着,AlphaFold2又对人类98.5%的蛋白质3D结构进行了高精度预测。进而,DeepMind团队公布了AlphaFold蛋白质结构数据库,其使已知蛋白质序列空间的结构覆盖范围空前扩大;该数据库初始版本包含了21个模式生物蛋白质组中超过36万个预测结构,很快将扩展到涵盖UniRef90数据集(已验证的蛋白质序列)的大多数(超过1亿个)代表性序列。这些进展对结构生物学技术是颠覆性的,体现在2个方面:蛋白质3D结构数据将指数性增长,从而为机器学习提供更好的数据基础,将使AI结构预测目前还存在的质量缺陷逐一被解决;由于蛋白质结构与功能是分子细胞生物学的基本科学问题,相关进展必将对生命科学产生深远影响。

中国生命科学高影响力研究贡献

2001—2021年高影响力论文情况分析

用科学文献数据库数据构建可视化图谱,可以宏观地分析一个国家科学研究的贡献和发展水平。对一个快速发展中的科技大国而言,用论文总数和篇均被引用数来评价都显然偏颇,论文总引用数相对合理。然而,如今中国研究与试验发展(R&D)全时人员当量已逾500万人年,远超欧美各国,因此聚焦分析高影响力研究活动更有意义。本文利用科睿唯安(Clarivate Analytics)公司的InCite科研评估分析平台仅对被引用次数在同领域方向前1%的高被引论文(以下简称“前1%论文”)进行分析。虽然可能会有少数例外(即其学术影响力并非真正高),而且科学论文不代表全部科技实力,但前1%论文总体上反映各方向上有较高学术影响力、出类拔萃的研究。图2为全球生命科学前1%论文数量产出最多的前15个国家(以下简称“15强”)构成的版图,展现近20年来高影响力研究产出在主要科技大国中的分布和相对位次及变化。中国生命科学研究在底子极薄、“跟踪发展”20年后,于21世纪第1个10年开始进入视野,以后呈现持续、强劲的增长势头。在第1个10年、第2个10年和近3年中,中国学者发表的前1%论文在15强总数中的占比分别为:生物科学(biological sciences),3%、10.4%和13.9%;医学(medical sciences),1.7%、7.1%和10.%;农学(agriculture sciences),6.2%、19.9%和25.9%(图3)。本分析中,部分二级学科在三大领域中有交叉;另,中国港澳台地区学者的贡献暂未统计。

中国生命科学高影响力研究显著性增多,代表整个研究水平实质性提升,这可归于4点:①中国对科技的重视,全社会R&D投入经费持续近20年的2位数增长,为生命科学研发提供了保障性资金。②科研队伍不断壮大,2013年以来中国R&D人员总数保持世界第一,包括学成回国和本土成长人才,形成了人才高地的基础。③国家围绕科学前沿领域设立了各类科技专项计划,并大幅改善科研条件和实验平台,国家自然科学基金的资助力度也不断加强。④广泛的国际合作。例如,近20年中,中国的国际合作论文为23%以上,其中,高影响力合作论文占比2.9%,是中国发表的全部论文中高影响力论文占比比例的2倍。生命科学领域情况也类似。

近10年中国生命科学领域的重要研究成果举例

如果说高被引用论文经过时间考验,属于回顾性的,那么每年由科技界评选出来的年度科学进展则属于科学热点。中国有2项生命科学年度进展相关评选活动。①科学技术部高技术研究发展中心(基础研究管理中心)组织的“中国十大科学进展”,始于21世纪初,由两院院士、国家重点实验室主任群和“973”技术项目首席科学家群投票产生;②年度“中国生命科学领域十大进展”,创办于2015年,由中国科学技术协会生命科学学会联合体选出。这2项评选结果常常高度吻合。前者历经20年,笔者过去因工作关系常常应邀对评选结果作整体点评,印象比较深。这里,对其近10年评选结果进行梳理,这些研究大多有明确的问题导向,或在科学上产生重要影响,或在医学和粮食安全方面展示了重大的应用价值。

分子遗传学和细胞生物学领域。发现精子RNA可作为记忆载体将获得性性状跨代遗传;揭示了一种精细的DNA复制起始位点的识别调控,Tet双加氧酶在哺乳动物表观遗传调控中的作用,以及人类原始生殖细胞基因表达与表观遗传调控特征等分子机制;发现营养匮乏引发细胞自噬的分子机制等。表观遗传学成果连续上榜,反映出分子遗传学的发展趋势;其中,中国学者贡献了全球15.5%的高引论文(2011—2021年)。

结构生物学领域。破解藻类水下光合作用的蛋白结构和功能;揭示非洲猪瘟病毒结构及其组装机制;揭示RNA剪接的关键分子机制;解析人源葡萄糖转运蛋白结构、阿尔茨海默病致病蛋白三维结构、TAL效应蛋白特异性识别DNA的结构基础。这些重要蛋白质复合物结构的解析,对理解其分子机器机理的意义重大。自从装备了冷冻电镜以后,中国学者解析了大批重要的蛋白质三维结构,包括一批新冠病毒重要蛋白质结构。然而,如前所述,AI预测蛋白质3D结构的能力越来越强大,结构生物学家已经在思考如何乘潮流而动、更加深入开展蛋白质结构与功能研究。

干细胞与再生医学、生殖与发育领域。中国科学家在早期率先用iPS干细胞克隆出小鼠以后,逐渐在细胞和动物克隆领域形成强大阵容。近期代表成果包括:深度解析多器官衰老的标记物和干预靶标;证实单倍体孤雄干细胞具有可替代精子和快速传递基因修饰的能力;基于体细胞核移植技术成功克隆出猕猴。近5年,中国学者在高被引论文中的贡献率为20.3%。中国科学院战略性先导科技专项“器官重建与制造”从器官原位再生、体外制造和异体再造等方面系统部署,挑战高等哺乳类复杂器官难以再生的根本问题;目前,该专项已经取得一批重要的原始性发现和技术创新,部分已经进入临床研究。

重大疾病机理与诊疗方面。提出基于DNA检测酶调控的自身免疫疾病治疗方案;构建出世界上首个非人灵长类自闭症模型;揭示抑郁发生及氯胺酮快速抗抑郁;建立胆固醇代谢调控的肿瘤免疫治疗新方法。两种天然产物靶向特异蛋白治疗白血病是中国科学家在率先成功治愈急性早幼粒白血病基础上的系统性贡献。中国学者首次揭示细胞炎性坏死(焦亡)的关键分子机制,为多种自身炎症性疾病提供了一个全新的药物靶点,重新定义了细胞焦亡的概念,开辟了一个新的程序性细胞坏死的研究领域。

病原生物学与传染病领域。中国学者在应对新冠肺炎疫情中作出了系统性贡献,从病原生物学、结构生物学、分子流行病学、免疫学、检测技术、药物、疫苗研发和应用,到临床诊治获得大量重大成果,高被引用论文1450余篇,热点论文200余篇,占比均为世界总数的20%。其中,“揭示新冠病毒(SARS-CoV-2)逃逸抗病毒药物机制”被评选为“2021年度中国十大科学进展”。其他重大进展包括:揭示了埃博拉病毒演化及遗传多样性特征;在H7N9禽流感病毒溯源和H5N1禽流感跨种间传播机制研究中获突破;乙型肝炎病毒(HBV)受体肝脏牛磺胆酸钠共转运多肽(NTCP)的发现为解决实验中HBV感染细胞难题和发展抗乙肝药物奠定了重要基础;通过揭示非洲猪瘟病毒结构及其组装机制,为解决抗非洲猪瘟病毒疫苗这个世界难题提供了基于结构生物学的解决方案。

农业生物学领域。调控植物生长—代谢平衡实现可持续农业发展;揭示水稻产量性状杂种优势的分子遗传机制;揭示蝗虫聚群成灾的奥秘——4-乙烯基苯甲醚是蝗虫的群聚信息素;生态学试验证实Bt转基因棉花种植可促进对害虫的生物控制。尤其重要的是,继半矮秆形状基因为代表的“绿色革命”之后,以袁隆平为代表的中国科学家成功实现了水稻杂交育种理论与技术的突破,是第二次飞跃。后来袁隆平倾其毕生精力培育的超级稻,亩产首破1000 kg(2014年中国十大科技进展新闻)。2017年,李家洋团队的“水稻高产优质性状形成的分子机理及品种设计”获国家自然科学奖一等奖,被杂交小麦之父李振声誉为“继‘绿色革命’和杂交水稻后的第三次重大突破,标志着‘新绿色革命’的起点”。中国学者的贡献,为全球粮食安全提供了重要技术路径,是对人类的重大贡献。

合成生物学领域。实现酵母长染色体的精准定制合成、创建出首例人造单染色体真核细胞,从而打开了染色体工程新的研究窗口;通过拓展密码子将病毒直接转化为活疫苗,安全且有效;设计了用于肿瘤治疗的智能型DNA纳米机器人。近5年,中国学者在高引用论文和热点论文中的贡献均超过20%。自从2021年创建了从二氧化碳到淀粉的无细胞人工合成途径以来,2022年又相继报道了最简酶促合成碳固定循环和从二氧化碳还原合成葡萄糖和脂肪酸。这些开创性研究试图将二氧化碳资源化,为工业生物制造提供多种路径,并有可能服务于“双碳”目标。

生物起源与演化。中国学者曾在澄江动物化石群取得了一系列举世瞩目的成果,被誉为“20世纪最惊人的科学发现之一”。近期中国学者采用古基因组研究揭示了近万年来中国人群的演化与迁徙历史,用大数据刻画出迄今最高精度的地球3亿年生物多样性演变历史,足见现代技术对经典传统学科的影响。

模式动物和实验工具。基于体细胞核移植技术成功克隆出猕猴,创建了非人灵长类自闭症模型,这些最接近人类的模式动物将为医学研究提供重要的支撑。中国物理学家、化学家和信息技术专家创造出多种科学工具,对生命科学的贡献不胜枚举,如可实现自由状态脑成像的微型显微成像系统、单个蛋白质分子的磁共振探测等。

中国生命科学研究未来发展趋势研判和建议

发展趋势

中国生命科学厚积薄发,10年进步显著,悄然改写世界生命科学版图。科技抗击新冠肺炎疫情是一个缩影。其间,中国科学家经受严峻考验,从基础研究到临床,表现可圈可点。发表前1%论文数量仅次于美国,单篇引用达成千上万次的前20篇论文大部分来自中国。其中,率先鉴定出病原并给出基因组序列、明确细胞ACE2是病毒的受体、提供临床治疗方案和经验等,对全球新冠肺炎疫情防控作出重大基础性共享。

中国生命科学未来发展,已具备3个优势:①研究水平普遍提高。这点已经被图2和3的数据证明,而且几乎在生命科学各个领域我国都有卓越的研究成果;从趋势来看,继续扩大影响力属于必然。②队伍不断发展壮大。在各个领域都有数量可观的团队在活跃着,形成金字塔人才结构,且仍然有青年人才红利。一个令人鼓舞的例子是,中国每年有100多支学生团队参加美国麻省理工学院创办的国际遗传工程机器(合成生物学,iGEM)大赛;一届接一届,保持了30%—40%的金牌纪录,这说明中国在生命科学及其交叉学科领域有优秀的青年后备军。③国家高度重视生命科学。已经设立了脑计划、干细胞与器官修复、合成生物学、生物大分子机器、微生物组学、前沿生物技术、IT(信息技术)-BT(生物技术)、诊疗装备、中医药、慢病防治、生殖健康等一系列重点计划和专项,并有明确的战略发展目标。国家自然科学基金则强调鼓励探索、突出原创等指导方针,加上中国科学院战略性先导科技专项等,共同协调支持中国生命科学研究。


问题分析和措施建议

中国生命科学在取得长足进步的同时,也有亟待要解决的问题及新的挑战。以下是相关思考及建议。

理顺各科技创新模块的定位分工和资源配置模式。经过40多年发展和持续改革,中国生命科学研究力量分布已经形成几大模块。由于模块之间并无明确分工,且资源配置模式无差别,在大家奋力前行的同时,产生同质化和无序竞争。例如,一个生命科学基础研究国家机构,70%以上的年度经费需要通过与其他模块同行竞争获得,这不同于国际上的通行做法,难以形成“铁打的营盘”和“百年老店”(即国际知名研究机构),也增加了整个科研体系的管理成本。希望在新的改革中予以解决。

处理好渐进式研究和颠覆性研究的关系。数十年来,中国科技逐渐告别跟踪性研究模式,历史性地站到了科学发展前沿。大家常说,当今教科书上的生命科学知识体系主要源于欧美科学家的贡献,期盼中国学者能够在开创新的研究方向上更多地发挥引领作用。笔者曾经与澳大利亚前政府首席科学顾问Alan Finkel谈及渐进式科研和颠覆性科研;得到的共识是,量变到质变是真实地存在。例如,正是由于在SARS病毒溯源方向长期的“冷板凳”研究,中国病毒学家在新冠肺炎疫情发生初期就能及时担当。在挑战重大科学命题和应用目标的同时,坚持广泛支持探索性研究,也同样重要。“从0到1”的创新常常刷新我们的三观,这本身就说明颠覆性创新源自创新沃土、科学海洋,难以“预测”和“设计”。

加快解决生物技术转化的难题。生物技术对人类健康和粮食安全作出了巨大贡献。中国农业科技进步贡献率已经超过60%,但与发达经济体的现代化农业相比还有不少差距。医药技术和生物医学工程的差距更明显,此不赘述。这里有3个原因:①竞争性的技术源于原始性创新,原始性创新需要大量非急功近利的研究积累——积累,是绕不过去的坎。②以论文为唯一导向的评价活动还普遍存在,不少研究活动是为了论文而做论文。然而,单位的论文指标上去了,转化研究人员却常常被边缘化,这也导致科研成果供给不足。  ③产学研机制在许多地区并没有实质性建立,从实验室到产业之间的鸿沟难以逾越。科技开发园区有不少成功的经验值得推广。例如,深圳市光明区政府与中国科学院深圳先进技术研究院共同创造的“楼上楼下创新创业综合体”是一个很好的模式,“将研究板块与初创企业的空间距离压缩为零”。

营造先进的科研文化和氛围。笔者曾与英国学者共同主持国家自然科学基金-牛顿基金支持的“促进新生物科技的公众理解”研讨班,分析和讨论新兴科研议题的公众参与与沟通模式、生命科学研究科研范式、科研管理、互信互助、知识共享、科学伦理与法律等。参与者的热情和智慧、前瞻性理念、乐于分享与相互启发的精神,让笔者想起许多校训、院训及其对莘莘学子的精神陶冶,先进的科研文化和环境氛围孕育先进的科学思想。反观,争“帽子”和“打招呼”风气一直以来深深困扰一线研究人员,侵蚀着科学精神,需要根治。

坚持开放性研究和国际合作。生命科学是人类命运共同体的联系纽带,具有长期的国际合作传统。但近些年,世界政治经济格局发生深刻变化,国际合作的传统被践踏。对InCtie/Web of Science数据库分析可见,中美学者合作发表的科学论文数量持续增长数十年并相互成为最大的合作伙伴,2019年双方合作论文达66600多篇,为历史最高。然而,2020年首度下降,减少1.5%,2021年继续下降5.9%(生命科学合作论文减少9%),2022年可能出现断崖式下降。此形势下,中国生命科学可充分利用世界卫生组织(WHO)和国际粮食及农业组织(FAO)等联合国和政府间组织机制、生命科学各类学术社团的平台和网络多媒体等形式,坚持开展合作研究,世界终将回归理性。

中国生命科学整体上已经转向高质量发展阶段。在继续扩大优势的同时,解决好存在的问题,用新的辉煌,建设健康中国、平安中国,打造科技强国,贡献人类。

(作者:张先恩,中国科学院生物物理研究所研究员,中国科学院深圳理工大学(筹)合成生物学院名誉院长。《中国科学院院刊》供稿)

返回顶部