近日,安徽大学人工智能学院教授叶盛、孙长银与中国科学技术大学教授江俊等合作,在国际上首次成功利用人工智能、分子动力学模拟和量子化学理论计算方法,高效准确地模拟了完整真实蛋白质的Amide II区域红外光谱,为蛋白质的氢键动态学研究提供了坚实的理论和技术支持。相关研究成果发表在国际顶级学术期刊《美国化学会志》上。
蛋白质在生命中扮演着重要角色,其功能与其不断演化的动态结构密切相关。虽然近年来人工智能模型在解析蛋白质的静态结构方面取得了巨大进展,但无法用于研究蛋白质动态结构的演化过程。
Amide II区域红外光谱作为蛋白质的“光学指纹”,能够提供蛋白质分子动态结构变化的详细信息,在蛋白质动力学研究中发挥着关键作用。然而,解析这些谱学信号需要在复杂波动环境中进行昂贵的量子力学计算。迄今为止,尚无一种方法能够高效准确地模拟完全真实蛋白质的Amide II光谱,这严重限制了其在蛋白质动态结构研究中的应用。
为解决这一问题,该研究团队创新性地将人工智能、分子动力学模拟和量子化学理论计算技术相结合,通过结合物理信息的分子描述符从而建立了可解释人工智能模型,可用于高效准确模拟任意蛋白的Amide II光谱,并且速度比传统的量子化学计算方法提高了至少五个数量级。更重要的是,所建立的机器学习模型具有优秀的可迁移性,可以预测训练集范围以外的蛋白质光谱响应,模拟不同状态下的信号变化。这项研究将先进的人工智能机器学习技术与量子化学理论方法相结合,展现出新兴研究范式。