蛋白质语言模型

ESM-2

2.5亿序列预训练的蛋白质互作潜能快速评估

2.5亿
预训练序列数
15B
最大参数量
1024
最大序列长度
无需MSA
仅序列输入

核心能力

ESM-2 由 Meta AI 开发,是目前最大的蛋白质语言模型之一。在 2.5 亿条蛋白质序列上进行自监督预训练,ESM-2 学到的表征隐含蛋白质的结构与功能信息,仅从序列出发即可进行互作潜能评估、功能注释与接触图预测,无需多序列比对或结构信息。

🎯

互作潜能评估

仅从序列出发快速评估蛋白质互作潜能

功能注释

预测酶活性、亚细胞定位、GO 功能等蛋白质功能属性

📈

接触图预测

从序列预测残基间接触图,辅助结构建模

技术特色

深入了解 ESM-2 的核心技术优势

⚙️

Transformer 架构

基于多层 Transformer 自注意力机制,捕获残基间的长程依赖关系与共进化信号,无需显式多序列比对。

📊

规模效应

从 8M 到 15B 参数的系统研究表明,模型规模增大显著提升结构预测精度。15B 模型的接触图预测接近 MSA 方法。

🔧

零样本预测

无需针对特定任务微调,直接利用预训练表征进行互作评估、功能预测等下游任务。

🚀

变体效应预测

预测氨基酸突变对蛋白质功能的影响,指导蛋白质工程与疾病变异解读。

应用场景

ESM-2 在生命科学领域的广泛应用

蛋白质互作筛选

从蛋白质组规模快速筛选候选互作蛋白对,缩小实验验证范围,提高发现效率。

功能注释

对未注释蛋白质进行功能预测,包括酶分类、亚细胞定位、通路归属等。

突变效应评估

评估单点突变对蛋白质稳定性和功能的影响,指导蛋白质工程与疾病研究。

接触图辅助建模

利用 ESM-2 接触图预测辅助蛋白质结构建模,对缺乏同源信息的孤儿蛋白尤其有效。

我们的服务

新智元生物科技提供的 ESM-2 专业服务

1

互作潜能评估服务

基于 ESM-2 对蛋白质序列进行互作潜能评估,快速筛选候选互作蛋白对。

2

功能注释服务

利用 ESM-2 表征进行蛋白质功能注释,预测酶活性、亚细胞定位等功能属性。

3

互作筛选+结构解析管线

结合 ESM-2 互作评估与 AF3 结构预测,提供从互作筛选到复合物结构解析的完整管线。

常见问题

ESM-2 仅从序列出发评估互作潜能,速度快、适合大规模筛选。AlphaFold-Multimer 需要序列与结构信息,精度更高但速度慢。建议先用 ESM-2 筛选,再用 AF-Multimer 精确预测。

不能。ESM-2 提供计算评估是预测性的,仍需实验验证(Co-IP、酵母双杂交等)。ESM-2 价值在于快速缩小候选范围,提高实验效率。

主要支持:1) 蛋白质互作潜能评估;2) 功能注释(酶分类、GO功能);3) 接触图预测;4) 突变效应预测;5) 蛋白质工程优化。表征可迁移到多种下游任务。

ESM-2 最大支持约 1024 残基。超长蛋白建议截取关键结构域评估,或分段处理后整合。ESM-3 支持更长序列但尚未完全开源。

体验 ESM-2 专业服务

新智元生物科技提供基于 ESM-2 的专业计算服务,助力您的科研与药物开发。

立即咨询
QR Code

扫码咨询技术顾问

微信扫一扫,获取专业咨询