ProtGPS是什么?一文让你看懂ProtGPS的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

ProtGPS概述简介

ProtGPS(Protein Localization Prediction Model)是麻省理工学院(MIT)和怀特黑德生物医学研究所推出的,基于深度学习的蛋白质语言大模型,用在预测蛋白质在细胞内的亚细胞定位。ProtGPS基于分析蛋白质的氨基酸序列,用进化尺度的蛋白质变换器(Transformer)架构学习序列中的复杂模式和相互关系。ProtGPS能预测蛋白质在12种不同亚细胞区域(如核仁、核斑点等)的分布概率,成功指导生成能特异性组装到特定亚细胞区域的新型蛋白质序列。ProtGPS能识别导致蛋白质亚细胞定位改变的致病突变,为理解细胞功能和疾病机制提供新的工具和视角。

ProtGPS的功能特色

预测蛋白质在细胞内的分布:预测蛋白质在12种不同亚细胞区域(如核仁、核斑点、应激颗粒等)的定位概率。

设计具有特定亚细胞定位的蛋白质:生成新的蛋白质序列,特异性地组装到目标亚细胞区域(如核仁或核斑点)。

识别致病突变对蛋白质定位的影响:分析突变对蛋白质亚细胞定位的影响,预测致病突变是否会导致蛋白质分布异常。

ProtGPS的技术原理

基于Transformer的序列学习:基于ESM2(Evolutionary Scale Model 2)架构,一种基于Transformer的蛋白质语言大模型。同时学习输入序列中所有氨基酸之间的关系,捕捉蛋白质序列中的复杂模式和相互作用。

神经网络分类器联合训练:

将ESM2与神经网络分类器联合训练。分类器的任务是根据ESM2提取的特征,预测蛋白质在不同亚细胞区域的定位概率。

训练数据集包括5480个人类蛋白质序列,序列被注释为属于12种不同的亚细胞区域,学习到不同亚细胞区域的蛋白质序列特征。

生成蛋白质序列的算法:为设计具有特定亚细胞定位的蛋白质,用马尔可夫链蒙特卡洛(MCMC)算法。在生成蛋白质序列时,考虑蛋白质的化学空间和内在无序性,确保生成的序列符合自然蛋白质的分布,能特异性地定位到目标亚细胞区域。

致病突变分析:分析致病突变对蛋白质亚细胞定位的影响。比较野生型和突变型蛋白质的定位预测结果,识别那些导致蛋白质分布改变的突变。用信息论中的Shannon熵和Wasserstein距离,用在量化突变对蛋白质定位预测不确定性的影响。

ProtGPS项目介绍

GitHub仓库:https://github.com/pgmikhael/protgps

arXiv技术论文:https://www.biorxiv.org/content

ProtGPS能做什么?

疾病机制研究:识别致病突变对蛋白质亚细胞定位的影响,帮助理解疾病发病机制。

蛋白质工程与药物设计:设计具有特定亚细胞定位的蛋白质,用在开发新型蛋白质药物或生物传感器。

细胞生物学研究:预测蛋白质在不同亚细胞区域的定位,助力细胞内蛋白质功能和相互作用的研究。

基因治疗与基因编辑:设计特异性靶向亚细胞区域的基因编辑工具,提高基因编辑的效率和特异性。

蛋白质功能注释与数据库构建:为蛋白质功能研究提供线索,助力构建更全面的蛋白质功能数据库。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • Maverick
    Maverick Maverick是一款使用AI生成的个性化视频,帮助电子商务店铺与每个客户建立个性化互动。通过Maverick,电子商务企业可以提高客户满意度和忠诚度...
  • Wavtool
    Wavtool WavTool是一款在浏览器中使用AI助手免费制作高质量音乐的产品。它提供了一系列强大的功能,包括音乐创作、音频编辑、混音和编曲等。用户可以通过简单的...
  • kreadoai
    kreadoai Kreadoai是一个AI数字营销平台,可提供多功能和多功能的AI视频创建。它支持140多种多语言,100多个数字人类图像,并允许您快速创建高质量的数...
  • Scira
    Scira Scira 是一个基于 AI 技术的搜索引擎,旨在通过强大的语言模型和搜索能力,为用户提供更高效、更精准的信息检索体验。它支持多种语言模型,如 Gro...
  • Clone Anyones voice in seconds with AI
    Clone Anyones voice in seconds with AI 克隆我的声音是一个能够在几秒钟内克隆任何人的声音,并将其应用于任何音频内容的产品。即使作为一个英语初学者,您也可以获得一个出色的英语声音和发音。它可以...
  • 百聆
    百聆 百聆是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成...
  • 海豚AI学
    海豚AI学 海豚AI学利用IV交互视频技术,打造沉浸式互动学习体验,通过个性化推荐和智能分析,为学生提供定制化学习路径,强化学习效果。产品背景信息显示,海豚AI学...
  • RunComfy
    RunComfy Runcomfy是一个基于云端的环境,可以在3秒内释放你的AI艺术创造力。每个工作流程都配备了所有必要的自定义节点和模型,确保开始无忧。点击网址了解更...