总机:025-58361106-801
传真:025-58361107-806
Email:info@njpeptide.com
地址:南京市化学工业园区方水路158号三楼
蛋白质折叠问题的解决基础:安芬森法则与AlphaFold
1961年,美国国立卫生学院的研究员安芬森(ChristianAnfinsen)揭示了一种奇特的现象。他介绍了一项实验的过程,其中,他使用了变性试剂打开牛胰核糖核酸酶蛋白分子,使得二硫键还原成巯基。由此,蛋白质原有的折叠结构被破坏,酶的活性也随之消失。之后,他将装有实验样品的烧杯暴露在空气中过夜。出乎意料的是,一夜之后,大部分酶的活性竟然恢复了,被破坏结构的蛋白质也重新折叠成原来的样子。这究竟有多神奇呢?打个比方,这就好比我们将一朵由铁丝编织成的花用老虎钳拉直,但一段时间后,那段被拉直的铁丝竟然自己变成了一朵花!
安芬森猜测,这种情况的出现可能是由于蛋白质多肽链中氨基酸的排列顺序,也就是所谓的蛋白质一级结构决定了它的三维结构。当一级结构确定后,多肽链会遵循热力学的定律,自动折叠成能量最小化的状态。这个猜测后来被生物学研究归纳为“安芬森法则”。安芬森因为这一重要法则在1972年获得了诺贝尔化学奖。
对于研究者来说,安芬森的法则为研究指出了一个重要的方向,即“蛋白质折叠问题”。根据这个法则,蛋白质的三维结构由其一级结构决定。理论上讲,人们可以根据分子间的能量优化规则,通过蛋白质的一级结构预测其三维结构。蛋白质的功能与其结构有很大的关联,因此,如果人们能充分了解蛋白质的三维结构,就可以根据这一结构来寻找甚至创造所需的蛋白质。由此产生的可能性是巨大的,有着广阔的想象空间。
然而,“理想很丰满,现实很骨感”。尽管“蛋白质折叠问题”的潜在价值看起来很大,但由于组成蛋白质多肽链的氨基酸数量非常多,因此通过其结构来预测蛋白质的折叠是非常困难的。因此,安芬森法则所指出的道路看似光明,但在很长一段时间内,却成了一条鲜有人走的路。
相比之下,生物学家们似乎更倾向于使用直接观测的方法来探究蛋白质的结构。从早期的X射线衍射法到最近发展的冷冻电镜法,随着实验设备的不断进步,人们通过实验探究蛋白质结构的能力也逐渐提高。然而,尽管如此,相对于蛋白质的巨大种类数量,人们通过实验探究蛋白质结构的努力仍然是微不足道的。
在2018年,出现了一次重大突破。在当年11月举办的第13届全球蛋白质结构预测竞赛(CASP)上,DeepMind的人工智能程序AlphaFold成功预测了43种蛋白质中的25种的结构,从而在参赛的98支队伍中获得了第一名。相比之下,第二名只预测准确了3种蛋白质的结构。更令人惊讶的是,对于某些蛋白质结构的预测,AlphaFold得出的结论甚至比使用X光衍射法和冷冻电镜法得出的结论更为准确。
AlphaFold是靠什么获得了如此优异的成绩呢?其实,它用的方法很简单:学习大量蛋白质的序列和结构数据,从中寻找氨基酸分子之间的相互作用,以及蛋白质片段之间的演化关系,然后再按照找到的规律对蛋白质的结构进行预测。
初战告捷之后,AlphaFold不断从生物学、物理学和机器学习领域的最新进展中汲取灵感,以此来升级自己的算法,其预测能力也获得了很大的提升。2022年7月28日,DeepMind在其官网发布了一篇名为《AlphaFold揭示蛋白质宇宙的结构》(AlphaFoldrevealsthestructureoftheproteinuniverse)的新闻,宣布AlphaFold已经对几乎所有已知蛋白质的结构做出了预测。随后,又将所有预测的蛋白质结构放到了网上,供科研人员自行下载使用。据不少下载了数据的科研人员反映,这些数据的准确率非常高。
虽然在未来的一段时期内,人们还需要继续对AlphaFold给出的预测数据进行验证,但可以说,困扰了人们半个多世纪的“蛋白质折叠问题”基本上已经得到了解决。
蛋白质折叠问题的解决基础:安芬森法则与AlphaFold