ProtGPS是什么?一文让你看懂ProtGPS的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

ProtGPS概述简介

ProtGPS(Protein Localization Prediction Model)是麻省理工学院(MIT)和怀特黑德生物医学研究所推出的,基于深度学习的蛋白质语言大模型,用在预测蛋白质在细胞内的亚细胞定位。ProtGPS基于分析蛋白质的氨基酸序列,用进化尺度的蛋白质变换器(Transformer)架构学习序列中的复杂模式和相互关系。ProtGPS能预测蛋白质在12种不同亚细胞区域(如核仁、核斑点等)的分布概率,成功指导生成能特异性组装到特定亚细胞区域的新型蛋白质序列。ProtGPS能识别导致蛋白质亚细胞定位改变的致病突变,为理解细胞功能和疾病机制提供新的工具和视角。

ProtGPS的功能特色

预测蛋白质在细胞内的分布:预测蛋白质在12种不同亚细胞区域(如核仁、核斑点、应激颗粒等)的定位概率。

设计具有特定亚细胞定位的蛋白质:生成新的蛋白质序列,特异性地组装到目标亚细胞区域(如核仁或核斑点)。

识别致病突变对蛋白质定位的影响:分析突变对蛋白质亚细胞定位的影响,预测致病突变是否会导致蛋白质分布异常。

ProtGPS的技术原理

基于Transformer的序列学习:基于ESM2(Evolutionary Scale Model 2)架构,一种基于Transformer的蛋白质语言大模型。同时学习输入序列中所有氨基酸之间的关系,捕捉蛋白质序列中的复杂模式和相互作用。

神经网络分类器联合训练:

将ESM2与神经网络分类器联合训练。分类器的任务是根据ESM2提取的特征,预测蛋白质在不同亚细胞区域的定位概率。

训练数据集包括5480个人类蛋白质序列,序列被注释为属于12种不同的亚细胞区域,学习到不同亚细胞区域的蛋白质序列特征。

生成蛋白质序列的算法:为设计具有特定亚细胞定位的蛋白质,用马尔可夫链蒙特卡洛(MCMC)算法。在生成蛋白质序列时,考虑蛋白质的化学空间和内在无序性,确保生成的序列符合自然蛋白质的分布,能特异性地定位到目标亚细胞区域。

致病突变分析:分析致病突变对蛋白质亚细胞定位的影响。比较野生型和突变型蛋白质的定位预测结果,识别那些导致蛋白质分布改变的突变。用信息论中的Shannon熵和Wasserstein距离,用在量化突变对蛋白质定位预测不确定性的影响。

ProtGPS项目介绍

GitHub仓库:https://github.com/pgmikhael/protgps

arXiv技术论文:https://www.biorxiv.org/content

ProtGPS能做什么?

疾病机制研究:识别致病突变对蛋白质亚细胞定位的影响,帮助理解疾病发病机制。

蛋白质工程与药物设计:设计具有特定亚细胞定位的蛋白质,用在开发新型蛋白质药物或生物传感器。

细胞生物学研究:预测蛋白质在不同亚细胞区域的定位,助力细胞内蛋白质功能和相互作用的研究。

基因治疗与基因编辑:设计特异性靶向亚细胞区域的基因编辑工具,提高基因编辑的效率和特异性。

蛋白质功能注释与数据库构建:为蛋白质功能研究提供线索,助力构建更全面的蛋白质功能数据库。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • mymap.ai
    mymap.ai MyMap.AI是一个将文本思路转化为脑图和演示文稿的AI工具。它通过简单的聊天界面,将您的文本思路转化为可视化的脑图和演示文稿。非常适合学生、教师和...
  • castos
    castos Castos是专为成长驱动品牌设计的播客托管平台。它提供了轻松的播客发布,从创建到分发。使用Castos,您可以轻松地接触并吸引更多的受众。...
  • Wine
    Wine Wine-ly是一款AI销售代理软件,通过销售发展代表的专业知识,将潜在买家引入前台。我们通过深入了解您的服务和市场,连接您与有兴趣的潜在客户,与传统...
  • AI Video Editing | Clipchamp
    AI Video Editing | Clipchamp Clipchamp AI视频编辑是一个使用AI技术增强视频编辑的工具。它包含自动合成、语音转文字、AI音频增强等功能,可以轻松创建各种类型的短视频。C...
  • Call My Link
    Call My Link Call My Link是一个带AI功能的个人视频会议工具,让你的在线会议效率提高10倍。你可以在一个浏览器窗口内主持、录制、搜索和总结视频通话。它就...
  • Any GPT
    Any GPT AnyGPT是一个统一的多模态大型语言模型,利用离散表示进行各种模态的统一处理,包括语音、文本、图像和音乐。AnyGPT可以在不改变当前大型语言模型架...
  • Microsoft 365 Copilot for Sales
    Microsoft 365 Copilot for Sales Microsoft 365 Copilot for Sales 是一款基于人工智能的销售工具,旨在通过自动化和智能化的方式提升销售团队的效率和业绩。它...
  • LazyGraphRAG
    LazyGraphRAG LazyGraphRAG是微软研究院开发的一种新型图谱增强型检索增强生成(RAG)模型,它不需要预先对源数据进行总结,从而避免了可能让一些用户和用例望...