导读:2021-07-20,围绕靶向蛋白降解领域的一个关键问题——哪些人类蛋白更可能被设计成 PROTAC 靶点——Nature Reviews Drug Discovery 文章提出 “The PROTACtable genome” 概念与评估框架。该工作将公开数据、药物化学可配体性、细胞定位、疾病相关性、蛋白结构和可及性等因素整合在一起,尝试为 PROTAC 靶点发现提供系统化优先级排序工具。其意义不在于宣布某一批靶点已经可以成药,而在于把以往高度依赖个案经验的靶点选择,转化为更可讨论、可复核、可迭代的数据框架。

事件背景

随着 PROTAC 从化学生物学工具逐步进入药物发现语境,行业关注点已经不再只是“能否降解某个已知靶点”,而是更进一步追问:在人类蛋白组范围内,哪些靶点具有被 PROTAC 化的基础条件,哪些靶点虽然具有疾病相关性,却缺少可用配体或合适细胞环境,哪些靶点则可能因为定位、结构可及性或生物学复杂性而需要更谨慎评估。

传统小分子药物发现通常强调可成药口袋、酶活位点、受体结合域以及明确的功能抑制逻辑。PROTAC 的出现改变了部分靶点评估方式:它不要求靶蛋白必须通过占据活性口袋产生持续抑制,而是依赖靶蛋白配体、E3 连接酶配体、连接子以及由此形成的三元复合物,将目标蛋白带入泛素化和蛋白酶体降解通路。因此,一个靶点是否适合 PROTAC,并不能简单等同于是否已有高亲和力抑制剂。

在这一背景下,“The PROTACtable genome” 的提出具有资源属性。它试图把分散在公开数据库中的配体信息、蛋白定位、疾病证据、结构信息和可及性线索组织起来,为研发团队提供早期筛选视角。对于药物化学团队,这意味着靶点选择可以更早纳入配体可得性和结构可操作性;对于转化医学和 BD 团队,则有助于把疾病相关性与降解技术可行性放在同一个坐标系中讨论。

核心内容

该工作的核心不是提出某一种新的 PROTAC 分子,也不是报告某个靶点的实验降解结果,而是建立一套围绕“可被 PROTAC 化”进行判断的框架。文章使用公开数据和规则,对人类蛋白靶点进行分层评估,关注哪些蛋白具备较好的 PROTAC 起始条件,哪些蛋白还存在明显信息缺口。

评估维度之一是是否存在可结合配体。对于 PROTAC 设计而言,靶蛋白配体是起点,没有可用结合分子,就难以构建能有效接近目标蛋白的双功能降解剂。但该框架也提示,配体存在并不等于 PROTAC 成功。配体的结合位点、亲和力、选择性、细胞活性、暴露方向以及连接子可接入位置,都会影响最终降解效果。

第二个重要维度是细胞定位。经典 PROTAC 主要依赖细胞内泛素-蛋白酶体系统,因此靶蛋白必须处在该系统能够作用的细胞环境中。核内蛋白、胞质蛋白、部分膜相关胞内结构域,与完全位于细胞外空间或分泌途径中的蛋白,面对的是不同的技术路径和可行性约束。将细胞定位作为筛选条件,有助于在早期排除一部分不适合常规 PROTAC 设计的对象。

第三个维度是疾病相关性。PROTAC 靶点不只是化学上“能做”,还需要生物学上“值得做”。如果一个蛋白在遗传学、转录组、蛋白组、疾病模型或临床观察中与疾病具有更清晰联系,它进入靶点优先级讨论的合理性就更高。该框架的价值在于把疾病证据与可配体性、定位和结构条件并列,而不是只按单一维度排序。

此外,蛋白结构、可及性和构象信息也被纳入考虑。PROTAC 的作用依赖空间组织:靶蛋白配体结合后,连接子能否把 E3 连接酶招募到有利于泛素化的位置,三元复合物是否稳定,目标蛋白表面是否存在合适赖氨酸位点或可接近区域,都会影响降解可能性。这些问题无法完全由数据库规则解决,但可以通过结构信息帮助早期判断。

机制与证据

从机制角度看,“PROTACtable” 不是一个单纯的“有配体靶点清单”,而是围绕 PROTAC 作用链条拆解前置条件。PROTAC 需要同时满足靶点结合、E3 连接酶招募、三元复合物形成、目标蛋白泛素化、蛋白酶体识别与降解等多个环节。任一环节受阻,都可能导致有结合但无降解、有细胞活性但降解不足,或出现选择性与预期不一致的结果。

因此,该框架把“可被 PROTAC 化”理解为概率和优先级问题,而不是二元结论。一个靶点如果已有高质量小分子配体、位于细胞内、与疾病有明确关联,并且具备结构信息和潜在可及表面,它可能更适合作为优先探索对象。相反,一个靶点即便疾病相关性强,如果缺少配体、定位不适合经典 PROTAC 通路,或结构与表面可及性信息不足,也需要更高实验投入才能验证。

这种评估方式有助于避免两个常见误区。第一,是把所有传统小分子靶点都直接视为 PROTAC 靶点。实际上,PROTAC 的设计受连接子、空间构象、E3 连接酶选择、细胞类型和蛋白周转等因素影响,不能仅凭已有抑制剂推断降解可行性。第二,是把疾病相关性强的蛋白直接视为可开发靶点。疾病证据可以提高靶点价值,但并不能自动解决配体发现、细胞递送和降解机制问题。

文章的证据基础主要来自公开数据整合和规则化判断,而不是单一实验体系。它更接近一个面向靶点发现的资源与方法学框架,服务于早期研发决策:在进入大规模合成、细胞筛选和机制验证之前,先用公开信息识别更值得投入的靶点群,并标记需要补充证据的薄弱环节。

为什么值得关注

对于 PROTAC 领域而言,该工作的第一层价值是把靶点选择从“项目经验驱动”推进到“数据框架辅助”。在早期靶向蛋白降解项目中,团队往往从已有高质量配体、热门疾病靶点或竞争对手项目出发,容易形成靶点集中化。“The PROTACtable genome” 提供了一种更系统的扫描方式,有助于发现被传统成药性评价忽略但可能适合降解策略的蛋白。

第二层价值在于支持研发资源配置。PROTAC 项目的投入不仅包括化合物设计和合成,还包括细胞模型、蛋白检测、降解动力学、选择性评估、E3 依赖性验证、蛋白组学确认和药代性质优化。若能在项目立项前对靶点进行分层,就可以减少过早进入低可行性靶点的风险,也有助于区分“值得立即推进”“需要先补配体”“需要先补结构信息”以及“暂不适合经典 PROTAC 路径”的不同类型。

第三层价值面向投融资和 BD 判断。靶向蛋白降解公司常以平台能力和靶点组合为核心叙事,但外部评估很容易被单个靶点热度或管线数量吸引。该框架提醒评估者关注更基础的问题:靶点是否有可用配体起点,靶蛋白是否处于合适细胞区室,疾病证据是否足以支持差异化开发,结构与机制是否能支撑可复制的降解设计。这样的视角有助于更冷静地判断平台项目的可执行性。

第四层价值在于帮助药物化学团队重新定义“可优化空间”。在 PROTAC 设计中,单个配体的亲和力并不是唯一指标。连接子接入点、配体暴露方向、三元复合物几何关系、细胞通透性、分子量和物化性质都会影响最终分子表现。把靶点层面的可行性与分子层面的优化问题拆开,有助于避免在不适合的靶点上过度优化,也有助于在有潜力靶点上更早开展结构和机制实验。

边界与待验证问题

需要强调的是,“The PROTACtable genome” 并不等于确定性的药物靶点名单。它提供的是优先级排序与信息组织工具,而不是替代实验验证的结论。一个靶点被评为较有潜力,并不意味着一定可以获得有效、选择性强、具备药物样性质的 PROTAC;一个靶点评分不高,也不代表在新配体、新化学空间或新实验设计下完全不可行。

其边界首先来自公开数据本身。公开数据库中配体、结构、疾病证据和细胞定位信息的覆盖并不均衡,热门靶点往往信息更丰富,冷门靶点可能因为研究不足而被低估。数据缺失不应被简单解释为靶点不可行,而应被视为需要补充实验证据的信号。

第二个边界是 PROTAC 机制本身的复杂性。三元复合物形成具有高度构象依赖性,E3 连接酶选择与细胞类型密切相关,目标蛋白的半衰期、表达量、亚细胞分布和蛋白复合体状态都会影响降解结果。这些因素很难仅凭规则和静态数据库充分预测,因此框架的输出更适合作为假设生成工具,而不是最终判断。

第三个问题是成药性。即使某个靶点在生物学和可配体性上适合 PROTAC,双功能分子的分子量、极性、构象柔性、细胞通透性和药代性质仍可能成为瓶颈。对于药物化学团队而言,“可被 PROTAC 化”只是进入项目讨论的前置条件,距离可开发候选物仍需要大量分子优化和体内外验证。

因此,理解这项工作的正确方式,是把它看作靶向蛋白降解领域的一张早期地图。地图可以帮助研发人员选择方向、识别空白、比较路线,但不能替代真实实验路径。它最适合用于靶点池构建、立项优先级讨论、平台项目组合设计以及跨团队沟通,而不是被当成简单的成功预测器。

参考信息