蛋白质(Protein)是生物构成的重要基本物质,由各种氨基酸组成,其排列方式和位置的差异使得其种类极其繁多、结构复杂,而这复杂的特性也就注定了研究蛋白质的路径困难重重。
面对数量庞大,结构复杂的蛋白质种类,为了能更快、更精准地预测出蛋白质结构,国家超算成都中心(以下简称:成都超算中心)联合百度,依据国际公认的开源项目Alphafold2,研发出国产化DCU蛋白质预测模型,从而让人类有机会从更深层次诠释生命体的构成和运作变化规律,全面揭示生命运行、发展机制,激发生物科学、药物研发、合成生物学等方面的发展,为我国生命科学发展带来了更多新的可能。
精准、高效、核心技术自主可控
Alphafold2模型国产化
面对海量的蛋白质结构信息,传统实验方法至今仅能解出10万个蛋白质结构,但由于氨基酸序列多达10亿,传统方法解出一个蛋白质的结构需要耗时数月甚至数年时间,时间成本巨大。
为弥补传统实验方法的不足,加速生命科学发展,实现核心技术自主可控,自2021年,成都超算中心与百度合作,基于百度飞桨螺旋桨PaddleHelix平台,依据国际公认的开源项目Alphafold2,进行了蛋白质结构预测推理计算的国产化开发,自主研发出国内特有的DCU生物计算-蛋白质结构预测Alphafold2模型。
该模型基于深度神经网络预测蛋白质结构,能够根据输入的氨基酸序列快速计算生成高精度的蛋白质三维结构,极大提升了预测效率,并使预测结果达到实际应用的精度要求。
▲成都超算中心 图片来源:成都市科技局
相关成果已发表在国际SCI学术期刊
以前花数月、数年的研究,现在只需几天就可完成
Alphafold2模型如何应用?
记者了解到,中国农业科学院都市农业研究所功能植物培育与应用创新团队联合成都超算中心,凭借Alphafold2成功预测蛋白质结构及相互作用,相关成果已成功发表于国际SCI学术期刊Froniters in plant science。
该项目负责人表示:“在传统的研究中,解析蛋白质结构及互作分析,需要进行X-射线衍射、冷冻电镜、酵母双杂等实验,工作量大,过程繁琐。成都超算中心搭载的Alphafold2解决了蛋白质结构精准预测的难题,加快了生物学研究。”
在Alphafold2模型中,平时需要花费数月、数年的才能完成的事情,只需要几天就可以完成。Alphafold2不仅加快了基础研究效率,还为后续深入的研究工作提供了丰富的数据资料。
此外,为实施农业科技增值行动,提高粮食生产的科技含量,四川农业大学农学院联合成都超算中心进行了小麦bHLH转录因子PGS1调控种子发育影响产量的分子机制解析,为将来培育高产高质小麦材料提供理论依据和备选基因。
研究人员表示,“传统研究只能通过实验的方法来获得目标基因的蛋白结构,费时费力,且花费巨大。而有了成都超算中心的蛋白预测技术支持,我们可以在短期内获得较高精度的基因蛋白预测3D结构,帮助我们从结构的角度解析基因功能。”
在Alphafold2的帮助下,团队成功预测出基因的蛋白结构,以及提前预测各个结构的功能,为后续研究提供了大量的数据基础。
红星新闻记者 彭祥萍
编辑 成序