人工智能作为一种识别和确定蛋白质结构的手段,功能越来越强大。比如不再局限于蛋白质单体的研究。它开始使用蛋白质复合物。然而.人工智能作为一种识别和确定蛋白质结构的手段,功能越来越强大。比如不再局限于蛋白质单体的研究。它开始使用蛋白质复合物。然而,与真核生物相比,人工智能更擅长模拟原核生物中的蛋白质复合物。为什么呢?因为当人工智能试图识别可能相互作用的蛋白质对时,如果进化信息可用,它将表现得更好、更多。当然,原核生物就是这种情况。
原核生物远多于真核生物。因此,对于原核物种来说,检测共同进化蛋白的机会更多。考虑两种蛋白质复合物的情况。据推测,这种复合物中的每种蛋白质都必须有一个相互作用结构域,以补充另一种蛋白质中的相互作用结构域。任何影响一个蛋白质相互作用结构域的突变必须伴随着影响另一个蛋白质相互作用结构域的突变。否则,蛋白质最终会停止相互作用。
除了原核物种的绝对数量,还有其他因素可以简化原核蛋白质复合物的分析。例如,在原核生物中,蛋白质较少,选择性剪接和基因组复制轮次不典型。这些因素减少了科学家在试图以计算方式模拟原核蛋白质复合物时必须处理的噪音。
虽然真核蛋白质复合物的计算和分析更具挑战性,但华盛顿大学蛋白质设计研究所和德克萨斯大学西南医学中心的研究人员并不气馁。他们决定使用两种基于深度学习的结构预测方法——RoseTTAFold和AlphaFold来应对计算挑战。华盛顿大学发明的RoseTTAFold用于计算蛋白质对的接触概率。AlphaFold由Alphabet的子公司DeepMind发明,用于重新评估相互作用概率和复杂结构建模。
利用蛋白质组中氨基酸的协同进化分析和基于深度学习的结构建模,科学家系统地识别并构建了酿酒酵母蛋白质组中核心真核蛋白质复合物的精确模型。科学家在11月11日发表在《科学》杂志上的一篇文章中详细介绍了这项工作。
这篇文章的作者写道,对830万对酵母蛋白进行了配对多重序列比对。1,505个可能的交互模型是106个先前未识别的组件和806个尚未进行结构表征的组件结构模型。这些复合物有多达五个亚单位,它们在真核细胞的几乎所有关键过程中发挥作用,并对生物功能提供了广泛的见解。