2月16日,Communications Chemistry 发表题为A machine learning-based pharmacokinetics predictor (EGFR-PROPK) for EGFR-targeting PROTACs的研究,报道了一个面向 EGFR 靶向 PROTAC 的药代动力学预测模型 EGFR-PROPK。该工作围绕 100 个 EGFR 靶向 PROTAC 分子开展体内实验,重点关注清除率、半衰期和表观分布容积等 PK 参数,并将传统机器学习方法与分子指纹特征结合,用于建立面向该类异双功能分子的性质预测框架。
对于 PROTAC 研发而言,药效活性并不是唯一筛选标准。EGFR 靶向降解剂通常同时包含靶蛋白配体、E3 连接酶配体和连接子,分子量、极性、柔性键数量与三维构象复杂度往往显著高于传统小分子。此类结构特征可能带来口服暴露、组织分布、体内清除和半衰期方面的不确定性,使候选物从细胞降解活性进入动物药代和药效验证时面临较高筛选成本。EGFR-PROPK 的提出,正是试图在 EGFR-PROTAC 这一具体靶点场景中,把实验 PK 数据转化为可用于早期设计反馈的计算工具。
研究背景:EGFR-PROTAC需要更早纳入PK约束
EGFR 是肿瘤治疗中的经典靶点,围绕 EGFR 突变、耐药和信号依赖性的药物研究已经形成较成熟的抑制剂体系。PROTAC 策略的不同之处在于,其目标不是单纯占据催化位点,而是通过诱导靶蛋白与 E3 连接酶形成三元复合物,促使靶蛋白被泛素化并经蛋白酶体降解。理论上,这种机制有机会影响蛋白的催化功能和非催化功能,也可能改变部分耐药背景下的药理干预方式。
但从药物化学角度看,EGFR-PROTAC 的结构优化比常规抑制剂更依赖多参数平衡。连接子长度、连接位点、E3 配体选择以及整体构象,都会同时影响细胞通透性、降解效率、三元复合物形成、体内暴露和组织分布。若仅以体外 DC50、Dmax 或细胞增殖抑制为筛选依据,候选分子可能在进入动物实验后暴露不足、清除过快,或分布行为不符合药效验证需要。因此,将 PK 参数预测前移到分子设计阶段,对提高 EGFR-PROTAC 的筛选效率具有现实意义。
核心进展:以100个体内实验分子构建EGFR-PROPK
本研究的核心数据基础来自 100 个 EGFR 靶向 PROTAC 分子的体内实验结果。研究关注的 PK 终点包括清除率、半衰期和表观分布容积,这三类参数分别对应药物从体内被清除的速度、维持暴露的时间特征,以及药物在血浆与组织间分布的表观行为。对于 PROTAC 这类大而柔性的分子而言,这些指标往往直接影响给药方案设计、体内靶蛋白降解窗口和药效持续性判断。
在建模策略上,EGFR-PROPK 将分子指纹作为结构表征方式,并结合传统机器学习算法建立预测模型。分子指纹能够把化学结构转化为可被算法处理的特征向量,反映片段、连接方式和局部结构信息;传统机器学习模型则可在有限规模数据集上寻找结构特征与 PK 参数之间的统计关联。与完全依赖经验规则相比,这类方法有助于捕捉 EGFR-PROTAC 内部结构变化对体内行为的综合影响。
- 数据对象:100 个 EGFR 靶向 PROTAC 分子。
- 实验维度:围绕体内药代动力学参数开展测定。
- 预测指标:清除率、半衰期和表观分布容积。
- 建模特征:结合分子指纹与传统机器学习方法。
- 应用场景:为 EGFR-PROTAC 早期结构优化提供 PK 预测参考。
技术意义:为TPD分子设计提供可计算反馈
EGFR-PROPK 的价值不在于替代体内实验,而在于尝试降低早期结构探索中的盲目性。对于 EGFR-PROTAC 项目,研究人员往往需要在多个连接子、不同连接位点和 E3 配体组合之间快速比较。如果模型能够在设计阶段提示某些结构组合可能带来较高清除率、较短半衰期或异常分布行为,团队便可更有针对性地安排合成和动物 PK 实验,把资源集中在更具成药潜力的分子系列上。
从 TPD 行业视角看,该研究也显示出一个重要趋势:PROTAC 的优化正在从“证明可降解”转向“可系统开发”。早期 PROTAC 研究更多强调靶蛋白能否被有效降解,而进入候选药物发现阶段后,PK、组织暴露、给药便利性和安全性窗口变得同样关键。以特定靶点和特定分子类别为边界建立预测模型,可能比试图构建泛化到所有 PROTAC 的单一模型更具可操作性。
风险与后续观察点
需要谨慎的是,EGFR-PROPK 的适用范围首先应被理解为 EGFR 靶向 PROTAC 场景。PROTAC 的 PK 行为受靶蛋白配体、E3 配体、连接子、整体构象以及给药方式等多因素影响,不同靶点和不同 E3 招募体系之间未必可以直接迁移。100 个分子的体内实验数据对于 PROTAC 领域具有建设性意义,但相较于传统小分子大规模 ADME 数据集仍属于有限样本,模型在结构空间外推时需要特别谨慎。
另一个观察点在于模型输出与真实项目决策之间如何衔接。清除率、半衰期和表观分布容积是重要 PK 指标,但它们并不能单独决定降解剂的临床前价值。EGFR-PROTAC 还需要同时考察细胞内靶蛋白降解深度、降解持续时间、EGFR 通路抑制、肿瘤组织暴露、选择性、安全性以及可开发剂型等因素。若未来在项目实践中使用类似工具,更合理的方式是将其作为多参数优化体系的一部分,而不是作为单一筛选门槛。
总体而言,EGFR-PROPK 为 EGFR 靶向 PROTAC 的药代性质预测提供了一个面向真实体内数据的机器学习范例。其意义在于把 PK 参数纳入早期设计语言,使研究者能够在合成、体外降解和动物实验之间建立更紧密的反馈循环。对于正在推进 EGFR 或其他肿瘤靶点 PROTAC 项目的团队,该研究提示:随着可共享、可结构化的体内数据逐步积累,TPD 分子的开发将越来越依赖计算模型、实验验证与药物化学判断之间的协同。