华盛顿大学蛋白质设计研究所创新之道及启示
中国网/中国发展门户网讯 新型研发机构作为顺应新一轮科技革命和产业变革的产物,已成为国家科技创新体系的重要组成部分。在生命科学领域,新型研发机构凭借新的组织形式和政策机制,是应对创新不确定性更高、研发与回报周期更长、产品化商业化更难等瓶颈问题的新生力量,也是推动开放创新生态构建、新兴产业与未来产业高质量发展、促进科技创新和经济社会发展深度融合的枢纽平台。近年来,由地方先行探索,一批生命科学新型研发机构加速落地并稳步发展,在促进产学研深度融合、科技成果产业化、区域创新体系建设等方面发挥了重要作用。截至2021年底,我国生物医药产业领域新型研发机构数量达581家,占新型研发机构总量的24.10%。这些生命科学新型研发机构整体上仍处于探索阶段,存在自身造血能力不足、运行机制不完善、学术影响力偏弱等问题。
美国、欧洲等国家和地区的一些非营利性科研机构,与我国推动建设的新型研发机构类似,其管理理念、组织模式、科研文化等具有借鉴意义。综合考虑相似度、科研实力、学术影响力和成果转化能力等因素,在诸多国外非营利性科研机构中,美国华盛顿大学蛋白质设计研究所(Institute for Protein Design)具有代表性。蛋白质设计研究所以打造蛋白质设计领域的“贝尔实验室”为目标,抢抓人工智能驱动科学研究(AI for Science)和开放科学(open science)发展的新机遇,开展了大量前沿、顶尖的跨学科研究,建立了高质量的科教产资协同创新生态,取得了系列引领性、颠覆性的创新成果。该研究所以蛋白质设计研究为基础,以开拓蛋白质领域产业化为目标,赋能技术供给、人才引育、成果转化、企业孵化,现已成为全球生命科学前沿创新的关键力量。探寻蛋白质设计研究所创新之道,并提出相关对策建议,可为我国生命科学新型研发机构高质量发展、自主创新能力提升提供理论与实践参考。
蛋白质设计研究所的历史沿革与创新成就
历史沿革
蛋白质是生命活动的主要执行者,也是合成生物学的关键底层元件。预测蛋白质结构、设计自然界中尚不存在的蛋白质,对于解码生命现象、生命活动规律和扩展对生物系统的操控能力具有重要意义,是生命科学领域亟待破解的重大难题。为赋能蛋白质科学突破及转化应用,基于David Baker团队在该领域的国际领先地位,华盛顿大学于2012年4月创建蛋白质设计研究所(以下简称“研究所”)。研究所主要依托美国华盛顿大学医学院建设,借助生物化学、工程学、计算机科学、医学等学科优势和西雅图地区的软件行业优势,开展促进区域协同创新和产业发展的有益探索。2014年6月,研究所设立转化研究中心(Translational Research Center),用于推动基础研究成果从实验室走向市场,并孵化初创企业。2015年1月,研究所成立顾问委员会、学术委员会,邀请科技、产业、金融、投资等领域的杰出代表担任成员,提供战略指导和学术支持。2017年,研究所进一步加强研发能力和平台建设,筹资1200万美元布局深度学习技术、广谱流感疫苗研发,并建成华盛顿大学首个冷冻电镜中心。2018年,研究所着眼于引领蛋白质设计革命(protein-design revolution)推出10年规划,重点布局抗病毒疫苗、蛋白质新药、纳米药物递送系统、蛋白质检测技术和新型纳米储能材料5个方向。面向AI for Science新范式,研究所进一步加强交叉研究、创新策源和技术供给能力,具体包括:将以深度学习为代表的人工智能(AI)前沿技术用于蛋白质设计,并与微软公司建立长期合作关系(2019年);在美国国际开发署(USAID)5年1.25亿美元资助下,牵头“病毒狩猎计划”(Wildlife Virus Hunting Programme),对全球人畜共患病病原体开展检测鉴定(2021年);推动蛋白质设计向环境修复、绿色制造、生物燃料和碳封存等领域拓展(2023年)。
成立以来,研究所走出了一条独具特色的“小而精”发展道路。在研究方向上,研究所当前主要布局蛋白质结构预测、蛋白质与小分子相互作用、自组装纳米材料、新型蛋白质骨架、酶设计和蛋白质结构测定6个科研方向,以及蛋白质治疗、新型疫苗、先进药物递送系统、生物组件、纳米材料、生物活性肽和算法开发7个应用方向。在力量规模上,截至2023年,研究所人员规模超过250人;其中,首席研究员(PI)4名,博士后、研究生和本科生逾125名。科研用房面积2800平方米,建有蛋白质制备、表征和工艺开发的11个实验室平台,以及算力基础设施。在经费来源上,研究所2023财年经费3300万美元,主要来自美国国会、国防部、能源部、国立卫生研究院等政府资助,以及TED“无畏计划”、比尔及梅琳达·盖茨基金会、华盛顿研究基金会、宝来惠康基金等非营利性组织和个人捐赠。
创新成就
成立至今,蛋白质设计研究所取得了令人瞩目的创新成就,并成为蛋白质科学领域的全球领军者。基于研究所科研成果产出,可以看出其在蛋白质科学、产业级蛋白质设计的主导地位。
标志性研究。研究所创新成果2次入选Science杂志年度十大科学突破。定制设计蛋白质(2016年)——通过计算生物学解析氨基酸的三维组装机制,获得具有特定功能的全新蛋白质,为新型药物和材料研发提供了新手段。AI预测蛋白质结构(2021年)——基于深度学习准确预测出成千上万个蛋白质结构,对结构生物学产生重大影响,有望大幅推动基础生物学研究、新药靶点发现。该研究是Science杂志年度十大科学突破之首,并被Nature Methods杂志评为年度技术。
论文发表。研究所不仅论文产出、被引频次呈现逐年上升趋势(图1),还具有卓越的研究质量(Science/Nature/Cell论文83篇、h指数101)、学术影响(篇均被引频次91.88、高被引论文60篇)、创新潜力(热点论文8篇)。近年来,随着开发蛋白质设计新工具RFdiffusion(2022年12月)、逆向从头设计全新蛋白质(2023年4月)、从头设计高亲和力结合蛋白质(2023年12月)等基础研究突破,研究所进一步拓展了蛋白质设计的边界。
专利授权。研究所着眼于布局蛋白质设计产业,获得100余项专利授权。授权专利重点方向为:针对蛋白质结构预测、蛋白质设计的通用技术方法,主要涉及建模方法、自组装体、蛋白质开关和新型蛋白质骨架等;针对特定功能蛋白质的设计优化,主要涉及酶、检测试剂和抗病毒多肽等。其中,大部分专利由世界知识产权组织、美国专利商标局授权,部分重要专利同步获中国、日本、德国等授权。
产品研发。研究所研发的新型冠状病毒疫苗SKYCovione已获批上市,同时肿瘤免疫药物NL-201、乳糜泻治疗药物TAK-062、流感疫苗FluMos-v1和FluMos-v2共4个药物进入临床试验阶段(表1)。其中,SKYCovione由全球卫生非营利性组织流行病防范创新联盟(CEPI)资助研发,是首款人工设计的纳米颗粒疫苗,被世界卫生组织(WHO)列入紧急使用清单,并获得韩国、英国批准。
蛋白质设计研究所创新特点分析
深耕基础前沿先做强再做大
原创性和引领性的生命科学基础前沿研究,具有探索性、不确定性、长周期性的特征,既需要敢为天下先、勇闯“无人区”的创新精神,又需要厚积薄发、“十年磨一剑”的战略定力。Baker团队深耕蛋白质设计领域,特别是在研究所成立并取得广泛支持后,坚持奉行长期主义,持续提升原始创新能力,赋能科学探索由易到难;不断加强技术供给,驱动转化运用由点及面。
Baker于1993年担任华盛顿大学生物化学系任助理教授后,着手独立开展相关研究工作。在研究方法上,有别于主流的结构生物学经典实验方法,Baker将计算生物学作为解谜的“金钥匙”。1996年,他带领团队编写可根据氨基酸序列解析蛋白质结构的Rosetta程序,并通过迭代优化在后续的国际蛋白质结构计算机预测系列比赛中持续保持领先。在研究策略上,Baker团队运用格点计算、众包科学等手段,解决计算资源不足、模拟难度大等难题。Baker团队于2005年发起Rosetta@home项目,在全球范围内利用闲置计算资源进行蛋白质计算;于2008年联合研发电子游戏Foldit,实现了蛋白质折叠的众包科学。基于上述方法策略,Baker团队成功设计首个非天然蛋白质Top7(2003年)、用于乳糜泻治疗的重组酶KumaMax(2012年),揭开了蛋白质从头设计(de novo protein design)的序幕,打通了“功能—设计—筛选”的计算链条。这些长期科学实践中的积累,为研究所创建奠定了坚实基础。
研究所创建后,继续围绕根据功能设计骨架、基于结构反推序列和预测筛选的底层逻辑进行布局。在共性技术创新上,研究所加快生物物理学、有机化学、免疫工程学、基因组学、生物信息学、计算生物学等多学科前沿理论与技术的交叉应用,迭代升级蛋白质设计软件工具箱。在研发能力建设上,研究所重点加强科研平台设施配备,形成了以计算工具为核心、学科交叉实验室为支撑的布局。其中,建有270个计算节点、500块英伟达GPU加速卡、9000个CPU内核的高性能计算基础设施。在此基础上,研究所实现了蛋白质-小分子互作、蛋白质亚基组装和可编程设计等技术突破。随着系列新型蛋白质的成功设计,研究所将转化应用由早期聚焦疫苗、药物,拓展至以生物医药、生物传感为主体,涉及碳封存、绿色制造、绿色农业、生物材料和生物燃料的产业布局。
AI赋能干湿结合领跑新范式
随着科学研究进入第五范式,生命科学和AI的交叉融合成为科学发展的重要趋势。在生命科学领域,AI技术已经成为推动前沿创新的加速器,也是应对组合爆炸问题的新引擎。研究所通过快速移植AI前沿技术赋能底层算法创新,结合湿实验规模化制备验证,形成干湿实验有机结合的迭代创新路径。
对于蛋白质结构预测这一组合爆炸型问题,重点是建立搜索策略,在一维氨基酸序列形成的海量三维结构状态空间中高效检索最优解。相比传统经验主义、小规模或大规模试错的方式,通过AI有效整合多模态实验数据、多学科知识实现理性构建,成为破解这一难题的关键。研究所率先将深度学习Transformer神经网络架构用于残基形状预测,成功开发trRosetta软件,在预测精度上实现了领先。在AlphaFold2软件运用端到端模型训练方法取得突破后,研究所迅速借鉴并开发RoseTTAFold软件,实现了可比拟的预测精度和更低的计算资源消耗,共同开启了AI赋能生命科学的新时代。
对于蛋白质设计这一无中生有型问题,重点是实现骨架生成、可表达序列筛选、预期结构匹配,构建与天然蛋白质特性相似、功能不同的新型蛋白质。相比主流的湿实验主导、干实验辅助模式,通过AI实现高维空间、多种约束条件下的智能设计,是破解通过实验方法无法解决问题的重要手段。相比单一的干实验模式,结合湿实验规模化制备验证,更为符合生命科学研究特点和发展规律。研究所开发的RFdiffusion软件率先运用计算机视觉方向的扩散模型,可完成蛋白质骨架的智能设计;ProteinMPNN软件通过快速优化深度学习Structure Transformer神经网络架构,可完成蛋白质三维结构高效反推氨基酸序列。Rfdiffusion、ProteinMPNN和RoseTTAFold软件共同实现了蛋白质设计的智能化。在此基础上,研究所结合湿实验规模化制备验证,形成了蛋白质设计的干湿耦合。在系列代表性论文中,研究所均采用干实验设计生成、湿实验制备验证的模式,并以大量篇幅展示湿实验结果。例如,在推出ProteinMPNN软件的论文中,研究所团队表达、验证了超过170个蛋白质,并解析了其中2个蛋白质结构,从而验证了软件的有效性。这一AI赋能、干湿结合的创新路径,开启了蛋白质从头设计的智能化时代。基于深度学习的蛋白质设计,入选Nature杂志2024年值得关注的七大技术。
推动创新链与产业链融合发展
当前,生命科学开放式创新的特征日益突出,基础研究、应用研究、开发研究和产业化界限趋于模糊,从创新到转化的周期逐渐缩短。研究所着眼于发掘蛋白质设计的广阔应用前景,塑造更为健康、可持续发展的世界,探索创新链与产业链“双链”协同,以前沿技术创新推动产业发展,催生新技术、新产品、新模式。
研究所依托转化研究中心设立“转化研究员计划”,在支持科学突破从创意走向产品、从实验室走向市场上发挥了关键作用。计划主要面向博士后,由生命科学发现基金会、华盛顿州研究基金会和华盛顿大学等提供资金支持,顾问委员会、学术委员会和华盛顿大学商业化中心等提供专业指导。计划梯度设置4个阶段:基础研究阶段,支持蛋白质科学基本问题探索,评估成果发展潜力与应用前景; 转化研究阶段,提供研发指导、经费资助和平台支持,提升技术成熟度;初创公司阶段,依托华盛顿大学提供创业指导、创业孵化,助推科研人员成为创业者; 衍生公司阶段,在西雅图地区推出独立法人公司,推动临床试验、产业合作和产品市场化。
“转化研究员计划”设立10年以来,研究所在蛋白质设计、新药研发、代谢工程、生物传感等领域孵化9家衍生公司,累计融资超过10亿美元(表2)。其中,新型纳米颗粒技术研发及应用具有代表性。该研究于2014年获“转化研究员计划”支持,由博士后Neil King负责。资助期满后,King将这一技术用于疫苗、药物递送功能性蛋白质纳米材料设计,并于2018年依托研究所孵化Icosavax公司,开展纳米颗粒疫苗的商业开发。Icosavax公司布局呼吸道合胞病毒与人类偏肺病毒联合疫苗(临床Ⅱ期)等4个管线的抗病毒疫苗研发,并于2021年在美国纳斯达克上市。2023年12月,英国-瑞典制药公司阿斯利康以11亿美元收购Icosavax公司及其新型纳米颗粒技术,显示出蛋白质设计在生物医药产业的应用前景、商业价值。
发挥战略科学家定向引航作用
战略科学家是在科技创新活动中,以前瞻性战略思维谋划方向布局、带动关键领域创新能力提升的关键少数。从初创起步到领军蛋白质设计革命,研究所创新创业的斐然成就,充分展现了所长Baker的帅才作用和独到价值。
在创新文化上,深刻把握生命科学交叉融合创新、使能技术驱动和生物医药产业规模增长的发展趋势,Baker明确了研究所科学家精神与企业家精神相结合的文化基因。作为研究所的“架构师”,他主张面向生命健康、可持续发展需求,攻关具有前沿性、挑战性和开拓性的科学问题、工程技术难题和产业技术问题。他倡导充分享受纯粹科研的乐趣,不以发表论文为终点,而是努力提升创新的质量、效益和价值。
在管理模式上,立足打造蛋白质设计的“创意工厂”,Baker采用进化科学“集体大脑”理念,通过实施扁平化、分布式、开放性管理,形成创新的集群效应、网络效应。以实验室管理为例,他发挥“中枢”作用,依靠基因组科学、生物工程、化学工程、计算机科学和物理学的交叉背景,引导跨学科、跨领域、多主体、多视角融合创新;坚持亲自指导研究生、博士后,鼓励自主选题、自由探索;营造宽松氛围,通过组会、年会、下午茶活动和户外团建等形式,激发思想碰撞、创新灵感。
在品牌塑造上,Baker坚持知识生成与影响力打造并重,以期建成蛋白质设计领域的“贝尔实验室”。通过引领蛋白质设计生成、构建开源算法软件生态、驱动产业化应用,研究所在成为关键核心技术原始创新策源地的同时,推动蛋白质设计从生命科学“舞台”的边缘迈向中央。基于品牌效应,研究所成为人才集聚“强磁场”,并通过培养、输出人才持续扩大国际影响。同时,Baker先后荣获生命科学突破奖(2021年)、威利生物医学科学奖(2022年),并被行业媒体STAT评为生命科学领域最具影响力的50位领导者之一(2024年)。
构建开放共享融合创新生态
大科学、大数据、大工程的当代科学研究范式,使跨组织、跨领域、跨地域、跨行业的联合研究成为生命科学研究的主要潮流。在数字化、智能化时代,科学运用众包思想、分布式计算和云平台等,成为让生命科学创新跑出“加速度”的关键。
在科研协作方面,凭借自身的学术影响力、科研硬实力、学术话语权,研究所构建形成以美国霍华德·休斯医学研究所、哈佛大学、梅奥诊所等100余家机构为核心,覆盖英国、加拿大、中国等130个国家和地区5000余家机构的协同创新网络。通过持续巩固战略引领地位、发挥辐射带动作用,实现了创新资源、动能和力量的广泛集聚。
在科企合作方面,研究所与安捷伦科技有限公司、微软公司、元宇宙公司、安进公司、启明创投公司等科技、互联网、医药、资本领域的9家全球行业领先企业建立了合作伙伴关系,获得了高质量的仪器设备、计算资源、制药技术、资本运营支持,有效加强了软件硬件实力、技术供给能力、产品创新潜力和市场适应能力。例如,微软公司价值400万美元、亚马逊网络服务公司价值100万美元的云计算资源支持及数据服务,提升了研究所的数据运算与存储能力。
在开放创新方面,不同于生命科学领域常规的资源互补合作模式,研究所采用计算机领域的开源社区开发、游戏化学习模式:建立完善了Rosetta社区(Rosetta Commons),通过线上学术联盟优化设计计算建模和蛋白质结构预测的Rosetta系列软件;开发Foldit游戏,借助众包模式吸引大众参与加速蛋白质研究,形成了生命科学交叉融合创新的新模式。其中,Rosetta系列软件已授权给30000个团体,支持了众多学术、产业研发项目,并且仍在运营升级。
对生命科学新型研发机构建设的启示
蛋白质设计研究所以基础前沿研究为根基,以拓展产业新兴领域为目标,实现了科研范式塑造、创新生态构建、资源优化配置、科技成果供给,具有重要借鉴意义。当前,生命科学已成为科技强国建设的重要突破口,提升原始创新、技术供给和产品生成能力,需要促进新型研发机构实现从量的积累到质的跃升。在吸取国外有益经验的同时,生命科学新型研发机构建设要充分利用好新型举国体制优势,探索中国特色发展道路,从而支撑我国在生命科学领域抢占国际竞争制高点、构筑发展新优势。
聚焦顶层设计加强制度保障
推动和保障新型研发机构高质量、可持续发展,是国家创新体系建设和科技体制改革的重要方向。基于大学、区域和国家的多元支持,蛋白质设计研究所迅速崛起,有效反哺了华盛顿州生物医药产业,并成为美国在该领域的重要创新力量。
在新型研发机构蓬勃发展的潮流下,要充分发挥新型举国体制优势,研究制定发展规划、管理制度,营造更加有利于创新和发展的政策环境。在顶层设计上,探索嵌入国家科技创新体系的路径措施,畅通晋升国家队的通道;突出科研特区优势地位,鼓励精准化、差异化、个性化改革探索,打造科研机制创新试验田;建立完善并退改规则,破除区域创新资源流动的制度障碍。在机制建设上,针对生命科学新型研发机构更多瞄准基础前沿研究、更加依赖政策支持与资金保障的特点,建立健全以质量、绩效、贡献为核心的综合评价机制,财政稳定支持与多元资助结合的经费保障机制,以及市场化运作、企业化管理的运营管理机制等。
立足以精立业抢占变革先机
大力推进关键核心技术攻关,努力取得原创性、迭代性、颠覆性创新成果,是提升科技创新引领力和国际竞争力的要义,也是新型研发机构建设布局的着力点。Baker带领团队致力于蛋白质设计研究,在研究所成立后持续深耕主业,是取得系列原创性、引领性成果的关键。
当前,生命科学进入数据爆发的新时代,AI驱动的生命科学研究新范式呼之欲出,迸发出一批快速发展的前沿研究方向。在建设布局上,应当以战略高度、长远角度、全球视野,围绕“小而精、小而特、小而强”的建设思路,进一步优化生命科学新型研发机构布局。注重瞄准国家急需的“高精尖缺”等领域,坚持从第一性原理出发,建设细分方向“一技之长”、新兴产业“一席之地”的生命科学新型研发机构,推动以点的突破抢占新兴产业发展先机。在研发模式上,面对新范式的机遇和挑战,需要生命科学新型研发机构高效运用AI前沿科技成果、数据资源和算力基础设施,着力开发自主原创的算法、软件,主动适应、把握和引领知识与模型双驱动的干湿结合模式。
突出市场导向集聚创新要素
生命科学技术行业市场规模日趋扩大,既向科技创新提出了巨大需求,也为成果转化提供了广阔土壤。蛋白质设计研究所打通科技研发、成果转化、企业孵化的创新创业链条,构建从实验室到产业化的桥梁枢纽、产学研用有机结合的创新网络,开放式创新、市场化创新特征突出。超大规模的市场是我国的重要优势,也是促进关键核心技术攻关的根本动力。
生命科学新型研发机构建设,需要充分借助市场机制的有利作用。在资源集聚上,发挥新型研发机构平台枢纽作用,吸纳学术界、产业界、投资界等多元化人才加入理事会,构建涵盖科研机构、医疗机构、投资机构和企业等的广泛合作网络;借助金融投资、科技金融等拓宽融资渠道,通过组织国际合作项目、科学计划主动布局和积极利用国际创新资源。在成果转化上,注重把握市场需求、市场机制、市场规律,构建从“0到1再到N”的成果转化体系,加强创业帮扶指导促进企业孵化,建立健全成果转化收益激励机制,推动科研人员参与成果的产业化、商业化、资本化,通过靠产业、靠市场实现“自我造血”功能。
坚持以人为本营造宽松环境
人才是第一资源,是科技创新的核心驱动力。营造良好科研生态环境,源源不断聚才、引才、育才,是提高科技创新质量效率的关键。蛋白质设计研究所竭力优化创新微生态、塑造品牌影响力,集聚战略科学家、科技领军人才和青年科技人才,为原始创新持续注入动能。
当前,我国在生命科学领域的科技帅才比较稀缺,交叉前沿方向的领军拔尖人才数量亟待提升,迫切需要科技创新与人才驱动同频共振。新型研发机构因其体制机制优势,能够有效发挥人才集聚的“磁场效应”,为生命科学前沿创新提供强大的人力资源保障。在创新环境上,通过建立实施基于创新质量与产业贡献的长周期人才评价机制,科学合理的容错免责机制,以及扁平化、模块化、开放化的科研人员管理模式等,营造崇尚创新、鼓励探索、干事创业、追求卓越的科研氛围。在人才建设上,进一步发挥战略科学家“关键少数”作用,建立以信任为基础的使用机制,赋予更大自主权和决策权;加强复合型人才培养,探索“人才+工程/任务”组织模式,进一步扩大职称自主评审权限并打破年龄、身份与职级等限制,建立与企业的人才双向流动机制,着力造就兼具科学家精神与企业家精神的领军拔尖人才。
(作者:赵润州、倪铭、法云智、伯晓晨、焦剑,军事科学院军事医学研究院。《中国科学院院刊》供稿)