聚焦生命领域三大科学问题,构建全息人体数字模型

发布时间:2021-08-10 13:59:48  |  来源:中国网·中国发展门户网  |  作者:丛斌 等  |  责任编辑:张蔚蓝
关键词:生命科学,信息科学,生命本质,能量-信息网络,数字生命,全息人体数字模型

以医学为例

中国网/中国发展门户网讯 科学研究范式正处在巨大的转变时期。科学范式转移的前提是,原有的范式已不能满足人们对科学技术的需求,或者现有的理论之间冲突频出。揭示物质本质、宇宙起源、生命本质是当今人类面临的三大科学难题。笔者认为,揭示上述三大科学难题之核心是揭示生命物质和非生命物质演变的四维空间运行规律,解析能量-信息在其中的网络传递机制。以基因组学、蛋白质组学、代谢组学等系统生物学为代表的生命科学领域的技术进步为医学在生物大分子、亚细胞结构、细胞、细胞间连接、组织、器官、系统和整体的诸多层面系统解析各生物分子、亚细胞结构、各细胞之间的网络化关联关系提供了可能。系统研究组织、器官、细胞及细胞内微观结构行使功能的时相性变化规律,可获得海量的生命活动数据,以及由这些数据衍生而来的新知识;并可将这些数据和知识转化为数学模型,再通过信息科学技术模拟、复现或再现相关生命活动的网络化过程,解密生命活动的本质。因此,生命科学与以大数据、云计算、物联网、人工智能等为代表的信息科学技术深度融合,是研究范式的转变,其从根本上促进了生命科学研究的进步。然而,目前生命科学研究却遇到了困境。以医学领域为例,由于人类对生命活动本质规律的认知不足,对大多数疾病的研究和治疗方面并没有大的突破。人类疾病模型仍然是以模式动物为基础。但是,动物疾病模型的发病过程、病理机制、发病状态和愈后康复等与真实的人体环境存在较大差异。因此,以动物模型研发的新药中相当一部分的治疗效果并不明显。这是我们必须正视和亟待解决的科学问题。

 

医学面临的困境

随着生命科学研究的发展,很多医学难题迎刃而解,人类健康水平得到极大提高,疾病谱也随之发生改变。然而,由于未能从整体上系统揭示生命的本质和演化规律,老病未解而新病又不断出现仍是临床医学必须面对的现状。尽管过去的1 个多世纪里现代医学得到了快速发展,但对人的整体生命活动规律的认知还停留在局部或碎片化阶段,一些新发现仍是在盲人摸象


过度依赖还原论方法使临床医学进步缓慢。对大多数疾病尤其是慢性疾病的认知和治疗,即使在后基因组时代的今天也还没有实质上的突破与进步。2013 年,诺贝尔生理学或医学奖获得者沃森宣称:多年来,通过基因序列治疗癌症或其他疾病的尝试是没价值的。由于受还原论的深度影响,过度依赖基因层面的治疗选项,把某些点或局部的变化认为是孤立的因素,忽视了任何疾病都是系统性问题的疾病本质属性。因此,现代临床医学对一些疾病的治疗总体上甚至退步了,而治疗费用却在大幅增加。例如,过度依赖化学药或生物制剂单纯对肿瘤细胞的单靶向治疗,其结果是易发生耐药,不能从系统和整体上解决肿瘤疾病问题。笔者认为,治疗肿瘤疾病应采取多靶向系统性干预和调节的机制:对肿瘤细胞进行靶向干预;对肿瘤细胞赖以生存的微环境进行多靶向干预;用系统调节的手段恢复肿瘤病人的机体稳态。


医学研究缺乏公理体系和数学计算。一般来讲,建立在受控实验所得到的公理之上的自然科学,具有可计算、可验证和公理性;然而,建立在结构学、功能学和生物实验观察之上的医学,所获的观察结果大多尚未实现数理逻辑上的公理化。在很大程度上,医学研究还没有吸纳计算医学的研究方式,无法透过现象看本质。例如,借助DNA 双螺旋只能观测基因结构二维构象的变化,却无法揭示更高维度的内在分子互作方面的数理逻辑关系。


一些新方法运用无法从根本上改变医疗现状。尽管当前化学制药技术得到了极大提升,但现代药学仍然停留在利用天然的和化学合成的物质治疗疾病的传统时代,这对人体生命活动和稳态改善有限。当前流行的微创治疗,其本质仍是一种外科手术,即以丢掉某些组织为代价来治疗疾病。当前所谓的互联网医学、人工智能医学并未实现医学与信息科学的真正融合,仅仅是信息技术在医学领域的简单应用。

 

生命领域研究应聚焦三大科学问题

生命领域的研究不能仅局限于用先进的观测手段揭示亚细胞水平或分子水平的微观结构——这些被发现的静态结构并不能表征生命的微观动态过程。一定的组织结构必定为执行一定的功能所存在。细胞、亚细胞或分子水平的微观生命活动,是基于一定的结构存在所表征的结构间系统互作,并以这种互作行使一定功能的时空变化动态过程。因此,要建立新的科学范式来研究生命领域的三大基本科学问题。


解析人体细胞微观结构。细胞是生命体的核心单元,人体是由约37 万亿40 万亿个细胞构成的复杂巨系统。随着微流控细胞分离、单细胞DNA/RNA测序、细胞原位分析、质谱流式细胞分析等技术的出现与成熟,通过单细胞分析可获得包括DNA 序列、RNA序列、蛋白质结构及其在细胞中的空间位置等相关的海量数据。我们可以用生物信息学方法对这些数据进行分析、筛选以建立细胞结构图谱数据库,解析构成人体的全部细胞内的可视化结构,并依据结构和功能对全部细胞进行分类。如果只通过细胞外部形态表征差异来分类,人体的细胞谱系和类型只有200300 种,但如果用人类细胞图谱分析技术,可能会发现10000 种以上的细胞谱系和类型。


揭示人体微观结构间的关联关系。在许多情况下,转录水平本身不足以预测蛋白质的表达水平,以及解释基因型与表型的关系。因此,要以复杂系统科学的整体论作为方法论,探索在生物分子、亚细胞结构、细胞、组织、器官等层级结构之间的相互作用中涌现出的新属性,并系统揭示它们之间的关联关系。例如,在细胞内的半胶体状态下生物大分子之间以布朗运动的形式进行的适配性结合,应该是定向性的运动,并不是无序运动的随机接触式偶遇性结合;因为如果是后者,将会消耗更多的能量,这似乎不符合生物进化的规律。笔者认为,决定一定结构的基因组DNA 不只是决定分子间适配性结合的结构学上的基因,同时也是决定分子做定向运动的能量-信息的基因。基因组DNA 是发出定向指令的信息源,其通过发出信息指导核酸分子间完成适配性结合、转录和tRNA 特异性携带氨基酸做定向转运。简言之,DNA蕴含着特定的指令信息,指导特定分子做定向寻偶运动,寻找相关的适配分子对象;并通过分子之间的适配机制,完成转录、修饰、翻译、装配过程。这些信息可能是DNA 分子在拓扑异构过程中发出的能量波。揭示这一重大科学问题,有利于从微观水平系统认知生命健康、疾病的本质,研发具有多靶向系统性调节和干预的有关健康管理、疾病预防和治疗的新药物和新技术。又如,冠状病毒包膜结构上有3 种蛋白——刺突糖蛋白(S 蛋白)、小包膜糖蛋白(E 蛋白)和膜糖蛋白(M 蛋白),而且冠状病毒中少数种类还有血凝素糖蛋白(HE 蛋白)。笔者认为,这些蛋白分子并不是彼此孤立存在的,它们之间具有分子动力学的动态关联关系,这是决定病毒活性、毒力、S 蛋白与宿主细胞受体亲和力的分子动力学基础。当囊膜上其他蛋白结构的某些表位受到扰动,可能也会通过拓扑变构影响S 蛋白的受体结合区域(RBD)的构象变化,进而影响其与宿主细胞受体的结合。这也许能够解释为什么新冠病毒灭活疫苗对S 蛋白的 RBD结构已发生变异的变种病毒感染仍具有一定的保护作用。由此可见,揭示生物大分子结构间的关联关系也是新药研发的重大基础科学问题。


探索人体微观结构及其功能的时相性变化规律。从受精卵形成到生命活动结束的全生命周期内,所有人体组织结构及其功能均会发生时相性的演变。笔者认为,探索生命物质和非生命物质演变的四维空间运行规律,解析能量-信息在其中的网络传递和转换机制,是当今人类面临的核心科学问题之一。生命的本质目前被认为是蛋白质及其他生物大分子的同化作用和异化作用的对立统一的运动过程。在此过程中,生物大分子以自我更新、自我复制、自我调节的方式维系生命整体活动所表征的高智能、自组织、自稳态,并进行新陈代谢、自我修复、自我繁衍。对这一过程进行系统解析是认知生命本质的又一重大基础研究,其揭示了随时间变化而变化的生物大分子结构动态特征、瞬时属性,以及由此而决定的细胞结构和功能状态,从而发现在不同基因结构、不同健康状况、不同生活方式和不同所处生活环境下人体生物大分子变构,以及细胞结构和功能状态的动态变化规律。因此,可采用密集数据驱动的科学范式,挖掘隐藏于高维度、高通量等多维融合的生物医学大数据中的新洞见,将生命实体模型转换为数字模型,以生物医学大数据作为输入参数,并以人工智能算法对模型进行迭代、训练,从而输出能够再现逼近于真实生命系统结构与功能的时相变化表征。

 

生命科学研究的方法论 

自然界没有无局部的整体,也没有无整体的局部。因此,探明任何复杂事物的本质,都必须对其进行剖析和简化;而要认识事物发展的全过程、观察事物的全貌,则必须对各个部分和细节进行系统化、整体化整合。


生命体是携带能够复制自己信息的结构。生命科学是通过分子遗传学为主的研究生命活动规律、生命的本质、生命的发育规律,以及各种生物之间和生物与环境之间相互关系的科学。现代医学以人体的生理、结构和疾病为主要研究对象,同时在还原论的指导下,注重结构性的实体实验,以空间变化为主要观察目标;然而,但它却无法同时获得空间和时间上的病症动态变化、生命功能的能量和信息变化等的系统认知。笔者认为,蛋白质及其他生物大分子同化和异化作用的对立统一的运动过程,是生物大分子相互作用、代谢更新、变异信息传递的网络化时相性演变过程。系统揭示这一复杂网络过程,研究疾病整体水平的系统发生机制,并在整体水平创新预防和治疗方法,是医学科学研究的重要方法论。简言之,揭示生命本质,不能只见树木不见森林,也不能只见森林不见树木,而是要既见树木,也见森林

 

人体能量-信息传递的网络化模型设想

人体能量-信息的网络传递假说

自然界中,能量和信息总是相伴而行,无处不在。宇宙的本质可能就是能量和信息。能量不同的聚集态形成了宇宙的三大构成——明物质、暗物质、暗能量;千差万别的明物质是能量在信息指导下的不同聚集态的表征。由此推论,作为生命体的典型代表——人体,也是由无时不在的能量-信息的网络化传递机制调节和维系其生命活动。其中,信息可能以生物微波的特殊形式存在,调节离子、分子在体内运动,参与维护细胞稳态;能量是生命活动的动力,维持体内生命物质的微观运动。生物分子的位移或变构需要信息的传递和能量的供给,能量-信息可以为构成生命体的各种微粒子有序运动提供指向和赋能,从而维持微环境体系的稳定。机体组织间的能量和信息还可与体外环境、体腔环境进行实时沟通交换。


人体能量-信息网络与中医学经络

笔者认为,中医学的经络可能是人体能量-信息流纵横交错、由表及里的网络化传输信道。经络在人体各系统间、器官间、组织间、细胞间、亚细胞结构及分子间行使能量和信息的传递联络功能;经络是联系脏腑、体表等全身各组织系统的复杂巨系统网络,是人体功能的调控系统,感应、接受、传导体内外信息,调节人体新陈代谢和生理机能。


人体在能量-信息网络(经络)调控下,维持其自稳态、新陈代谢,自行运动、自我修复、自我繁衍。人体在能量-信息网络(经络)的载体形式可能是细胞骨架、细胞膜、细胞间连接、组织内及组织间的结缔组织。人体的这种能量-信息网络(经络)结构和功能通过物理及信息技术的创新有可能会实现可视化。


研制全息人体数字模型的设想

证明人体能量-信息的网络传递假说,需要将生命科学与信息科学相关理论和方法进行深度融合,在探索生命本质的过程中发现新的理论和方法。从分子、亚细胞、细胞、组织、器官,到系统和整体结构的系统生物学研究中会有各种信息和数据产生,其数据具有庞杂和多量化特征。这些数据是揭秘生命活动本质的基础资料,是有史以来数据结构最复杂、规模最庞大、内容最丰富的科学大数据。因此,需要创新算法,对庞杂的生命科学大数据进行清洗、分类、定量分析和综合集成,以揭秘生命科学大数据背后的生命活动过程和规律,并以数学方式表达、构建数字模型。依据人体生命科学大数据构建的数字模型,可能会有效模拟、再现或复现微观和宏观生命活动过程,进而重构生命体四维空间,从而揭示结构间的关联关系和所表征功能的时相性变化规律,并解析物质、能量与信息之间的转化形式。基于上述研究,通过人工智能构建自动化、自适应的全息人体数字模型,可以定性、定量、定位地描述生命活动过程、人体健康状态、疾病程度及治疗效果和转归。


值得强调的是,基于伦理学要求,目前医学领域的疾病模型研制基本采用的是模式动物。然而,以动物疾病模型为工具在揭示有关人类生命活动规律,以及建立疾病干预技术方面,会因物种差异而出现各种各样的难题和矛盾,研发的一些药物在临床应用中的真实疗效并不确切,且副作用多;导致一些新药在临床应用中生命周期短。改变这一窘境,须转变研究范式,用多学科交叉组合技术刻画人体全息生命系统,构建全息人体数字模型。此为医学科学领域的一项重大研究计划,需要创新算法、提高算力,从而获取足够的有关人类生命科学大数据。近1 个世纪以来,人们在分子水平进行了诸多的散点式研究,所获数据不少,但数据之间缺乏逻辑性和系统性。刻画人体全息生命系统首先要采用计算医学的方法汇总所有相关文献,将已发表的有关揭示人体生命活动和疾病状态的大量数据进行清洗、分类、定量分析和综合集成,然后纳入揭秘生命本质的科学大数据库,用于构建全息人体数字模型。

 

人体全息生命系统网络解析的科学意义

截至目前,人类大多数的科学发现和技术创新仍属于仿生学的研究范畴,基于人体生命活动模式的仿生学研究应该是当今工业革命发展进步的重要目标。人体是最复杂的高智商网络运行系统,对人体全息生命系统网络解析的科学研究,模拟人体生命活动网络的仿真研究,应作为生命科学与信息科学、工程技术、物理学、化学等多学科相互借鉴、相互融通的大科学研究计划,其科学意义重大而深远。


可改变生命科学的实验研究范式。利用构建的全息人体数字模型可以全面系统地复制人类各种疾病模型(数字疾病模型)。该模型在很大程度上可以明显改善动物疾病模型与人类疾病状态的异质性,同时也可减少实验动物的使用。


可促进生命科学研究的全球合作与共享。构建全息人体数字模型是关系人类生存、健康和可持续发展的重大战略研究,实施该项重大研究计划,能够推动全球生命科学领域与其他领域的广泛交流合作,促进构建人类命运共同体。


全面认知人的生命本质,精确防治疾病。在系统论和整体观的方法论指导下,把获得的局部生命物质运动和演化的研究结果纳入全息人体数字模型,验证其科学性和真实性,评价其对疾病诊治的科学技术价值,以期达到对人类疾病的系统精准诊治和预防。此种研究范式可使生命科学研究成果逼近真实,揭示人的生命本质,推动脑科学研究向纵深发展,揭示某些慢性疾病发生发展的确切机制。


促进仿生学发展乃至科学技术全面进步。人体全息生命系统的解析为互联网技术发展提供了仿生学基础。人体能量-信息网络有可能是最智能、自组织程度最高的网络模式;互联网技术可以模仿人体的能量-信息网络结构和逻辑连接,创新升级,实现质的飞跃。交叉领域涌现出的科学新洞见又可以推动其他相关学科的发展,因此对人体全息生命系统解析的研究可以促进数学、物理学、化学、生命科学信息科学、制造业、农业等领域的科学技术全面进步。 (作者:丛斌,河北医科大学、中国医学科学院;张世明,贝格迈思(深圳)科技有限公司;倪志宇,河北大学。《中国科学院院刊》供稿)。

 


返回顶部