7月1日,Nature Communications 发表题为“SE(3)-equivariant ternary complex prediction towards target protein degradation”的研究,介绍了 DeepTernary:一个面向靶向蛋白降解三元复合物结构预测的深度学习框架。对于 PROTAC 与分子胶降解剂而言,药效并不只由单一配体亲和力决定,E3 连接酶、目标蛋白与小分子之间能否形成合适、稳定且可促成泛素化的三元复合物,是降解效率、选择性和成药性的关键变量。DeepTernary 的提出,正是试图把这一结构瓶颈转化为可计算、可筛选、可迭代优化的问题。

事件背景:三元复合物仍是 TPD 理性设计的核心难题

PROTAC 通过双功能小分子同时招募目标蛋白与 E3 连接酶;分子胶降解剂则通常以更小、更单价的形式稳定或诱导蛋白—蛋白相互作用。两类降解剂机制不同,但共同点在于都依赖诱导型三元复合物。对药物化学团队来说,三元复合物结构能够回答一系列关键问题:连接子长度和取向是否合理,E3 与目标蛋白界面是否形成有利接触,潜在泛素化位点是否可及,以及是否存在可能导致选择性差异的界面特征。

问题在于,实验获得此类结构并不容易。X 射线晶体学和冷冻电镜可以提供高价值信息,但对蛋白纯化、复合物稳定性、样品均一性和实验周期都有较高要求。传统蛋白—蛋白对接、分子对接和分子动力学方法虽可用于建模,但通常需要大量候选构象生成、能量筛选与人工判断,在 PROTAC 的柔性连接子和分子胶的弱瞬时界面面前,计算成本与准确性均面临挑战。

核心进展:从 TernaryDB 学习三元相互作用规律

研究团队构建了名为 TernaryDB 的大规模三元复合物数据集,从 PDB 中筛选包含两个蛋白和一个小分子的高质量结构,最终用于训练的数据规模超过 2 万个复合物。为降低数据泄漏风险,作者在训练集中排除了与已知 PROTAC 和分子胶诱导复合物相似的样本,希望模型学习的是更一般的三元相互作用规律,而不是记忆少数已解析降解剂结构。

DeepTernary 的模型架构以 SE(3) 等变图神经网络为基础,将两个蛋白和一个小分子分别表示为几何图,并在图内与图间进行信息传递。SE(3) 等变设计的意义在于,模型能够在三维空间旋转和平移下保持合理的几何一致性,这对于蛋白—小分子—蛋白复合物的结构预测尤其重要。模型还引入三元图间注意力机制和基于查询的 pocket points decoder,用于推断复合物最终的对接姿态与配体构象。

在输入层面,DeepTernary 可使用目标蛋白与 E3 连接酶的结构文件,以及由 SMILES 或结构文件表示的小分子信息。对于 PROTAC 体系,模型可利用未结合结构中的口袋点信息;对于分子胶相关体系,则需要同时预测小分子和第二个蛋白相对于第一个蛋白的空间定位。这使其既覆盖双功能降解剂,也尝试进入更难建模的分子胶诱导复合物场景。

技术意义:为连接子、界面和降解潜力提供结构假设

论文报告称,DeepTernary 在 PROTAC 与分子胶相关基准测试中取得了优于既有方法的表现,并展示出较快的推理速度。更值得 TPD 领域关注的是,作者发现由预测结构计算得到的埋藏表面积等界面特征,与部分实验降解效力指标存在相关性。这并不等同于模型能够直接替代细胞实验预测 DC50 或 Dmax,但说明三元复合物结构特征可以作为降解剂优化中的重要中间变量。

对于药物化学项目,DeepTernary 的潜在应用场景主要包括:在合成前比较不同连接子设计对 E3—目标蛋白接近方式的影响;评估候选分子是否可能形成更大或更合适的蛋白—蛋白界面;辅助解释同一 warhead 或 E3 配体组合中不同连接子导致的降解差异;为后续晶体学、HDX-MS、交联质谱或突变验证提供结构假设。对于分子胶发现,模型若能在弱界面、低亲和力和瞬时复合物上持续提高稳定性判断能力,将有助于减少完全依赖表型筛选的盲区。

  • 对 PROTAC:有助于围绕 linker 长度、柔性、出口向量和三元界面进行更早期的计算筛选。
  • 对分子胶:提供从“是否诱导相互作用”走向“可能如何诱导相互作用”的结构线索。
  • 对平台建设:为 TPD 数据库、结构建模、活性数据和自动化设计流程之间的整合提供接口。

风险与后续观察点

DeepTernary 代表了降解剂结构建模的重要进展,但仍应被视为结构假设生成工具,而非可直接给出临床候选优先级的判定器。TPD 活性受到细胞内 E3 表达、目标蛋白丰度、亚细胞定位、泛素化位点可及性、蛋白周转速率、化合物通透性、代谢稳定性和暴露水平等多因素影响。即便模型给出看似合理的三元结构,也不能保证细胞内一定产生高效、选择性的降解。

此外,公开可用的 PROTAC 与分子胶三元复合物实验结构仍然有限,分子胶体系尤其复杂。模型训练数据虽通过通用三元复合物扩展规模,但其对不同 E3 家族、柔性蛋白、无序区域、诱导契合、水分子介导相互作用以及非典型界面的泛化能力,仍需要更多外部实验验证。后续值得观察的方向包括:DeepTernary 是否能在更多未见过的 E3—靶蛋白组合上保持可靠表现;预测结构能否指导真实项目中的 SAR 决策;以及其输出的 PAE、DockQ、界面面积等指标能否与降解效率、选择性和毒性窗口建立更稳健的关联。

总体而言,DeepTernary 的价值不在于给 TPD 设计一个“一键答案”,而在于把三元复合物这一长期依赖低通量结构实验与专家经验的问题,推进到可规模化计算建模的新阶段。对于正在从经验驱动走向结构与数据共同驱动的 PROTAC 和分子胶研发而言,这类工具将成为降解剂发现流程中越来越重要的早期过滤和机制解释模块。