ESM-2 由 Meta AI 开发,是目前最大的蛋白质语言模型之一。在 2.5 亿条蛋白质序列上进行自监督预训练,ESM-2 学到的表征隐含蛋白质的结构与功能信息,仅从序列出发即可进行互作潜能评估、功能注释与接触图预测,无需多序列比对或结构信息。
仅从序列出发快速评估蛋白质互作潜能
预测酶活性、亚细胞定位、GO 功能等蛋白质功能属性
从序列预测残基间接触图,辅助结构建模
深入了解 ESM-2 的核心技术优势
基于多层 Transformer 自注意力机制,捕获残基间的长程依赖关系与共进化信号,无需显式多序列比对。
从 8M 到 15B 参数的系统研究表明,模型规模增大显著提升结构预测精度。15B 模型的接触图预测接近 MSA 方法。
无需针对特定任务微调,直接利用预训练表征进行互作评估、功能预测等下游任务。
预测氨基酸突变对蛋白质功能的影响,指导蛋白质工程与疾病变异解读。
ESM-2 在生命科学领域的广泛应用
从蛋白质组规模快速筛选候选互作蛋白对,缩小实验验证范围,提高发现效率。
对未注释蛋白质进行功能预测,包括酶分类、亚细胞定位、通路归属等。
评估单点突变对蛋白质稳定性和功能的影响,指导蛋白质工程与疾病研究。
利用 ESM-2 接触图预测辅助蛋白质结构建模,对缺乏同源信息的孤儿蛋白尤其有效。
新智元生物科技提供的 ESM-2 专业服务
基于 ESM-2 对蛋白质序列进行互作潜能评估,快速筛选候选互作蛋白对。
利用 ESM-2 表征进行蛋白质功能注释,预测酶活性、亚细胞定位等功能属性。
结合 ESM-2 互作评估与 AF3 结构预测,提供从互作筛选到复合物结构解析的完整管线。
ESM-2 仅从序列出发评估互作潜能,速度快、适合大规模筛选。AlphaFold-Multimer 需要序列与结构信息,精度更高但速度慢。建议先用 ESM-2 筛选,再用 AF-Multimer 精确预测。
不能。ESM-2 提供计算评估是预测性的,仍需实验验证(Co-IP、酵母双杂交等)。ESM-2 价值在于快速缩小候选范围,提高实验效率。
主要支持:1) 蛋白质互作潜能评估;2) 功能注释(酶分类、GO功能);3) 接触图预测;4) 突变效应预测;5) 蛋白质工程优化。表征可迁移到多种下游任务。
ESM-2 最大支持约 1024 残基。超长蛋白建议截取关键结构域评估,或分段处理后整合。ESM-3 支持更长序列但尚未完全开源。
扫码咨询技术顾问
微信扫一扫,获取专业咨询