Evo 2是什么?一文让你看懂Evo 2的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

Evo 2概述简介

Evo 2 是美国弧形研究所、英伟达、斯坦福大学等机构合作推出的DNA语言大模型,用于基因组建模和设计,覆盖生命的所有领域。Evo 2 基于 StripedHyena 2 架构开发,以单核苷酸分辨率处理长达100万个碱基对的上下文长度。Evo 2 用 OpenGenome2 数据集进行自回归预训练,数据集包含来自生命所有领域的8.8万亿个标记,支持长序列建模、DNA序列生成和嵌入向量提取等功能,提供多个模型检查点满足不同需求。Evo 2 推动基因组学研究和应用,为生物医学和合成生物学等领域提供强大的工具支持。

Evo 2的功能特色

长上下文建模:处理长达 100 万个碱基对 的 DNA 序列,支持高精度的基因组建模。

DNA 序列生成:根据给定的提示生成新的 DNA 序列,适用于合成生物学和基因编辑。

嵌入向量提取:提取 DNA 序列的嵌入向量,用于下游分析,如基因功能预测和变异效应分析。

零样本预测:支持零样本学习,例如预测基因变异对功能的影响(如 BRCA1 基因变异效应预测)。

序列评分:计算 DNA 序列的似然分数,评估序列的稳定性和功能潜力。

Evo 2的技术原理

大规模数据训练:基于超过 9.3 万亿个核苷酸的数据进行训练的,据来自超过 12.8 万个基因组,涵盖细菌、古菌、真核生物等多个生命领域的生物。

独特的 AI 架构:基于 StripedHyena 2 架构,处理长达 100 万个核苷酸的基因序列,理解基因组中相距较远部分之间的关系。

深度学习与生成生物学:基于深度学习技术,像理解语言一样理解核酸序列。用学习进化过程中形成的生物序列模式,预测基因突变的影响并生成新的基因组。

强大的计算支持:Evo 2 的训练利用英伟达的 DGX Cloud AI 平台和超过 2000 个 H100 GPU,展示了强大的计算能力和高效的模型训练。

Evo 2项目介绍

项目官网:https://arcinstitute.org/news/blog/evo2

GitHub仓库:https://github.com/ArcInstitute/evo2

HuggingFace模型库:https://huggingface.co/arcinstitute

技术论文:https://arcinstitute.org/manuscripts/Evo2

Evo 2能做什么?

疾病预测:识别基因突变是否致病,辅助疾病诊断。

基因治疗:设计细胞特异性基因治疗工具,减少副作用。

合成生物学:设计新基因组,助力人工生命研究。

进化研究:识别基因序列模式,研究生物进化。

生物工具开发:设计生物传感器等工具,推动生物技术发展。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • Repopack
    Repopack Repopack是一个强大的工具,它可以将您的整个代码库打包成一个单一的、AI友好的文件,非常适合将代码库提供给大型语言模型(LLMs)或其他AI工具...
  • EVI 2
    EVI 2 EVI 2是Hume AI推出的新型基础语音对语音模型,能够以接近人类的自然方式与用户进行流畅对话。它具备快速响应、理解用户语调、生成不同语调、以及执...
  • Retell AI
    Retell AI Retell AI是一个能够帮助开发者在一天内构建人类般对话语音AI的API。它具有大约800毫秒的响应时间,并能够处理中断。使用Retell AI,...
  • QWiser
    QWiser QWiser是一个利用人工智能技术将传统学习材料转化为个性化学习体验的平台。它通过将复杂的学习内容分解成易于管理的主题,并创建定制的测验,帮助学生更有...
  • vta-ldm
    vta-ldm vta-ldm是一个专注于视频到音频生成的深度学习模型,能够根据视频内容生成语义和时间上与视频输入对齐的音频内容。它代表了视频生成领域的一个新突破,特...
  • setapp
    setapp SetApp是一项全面的订阅服务,可提供精心挑选的Mac和iOS应用程序。满足各种需求,它包括用于生产力,创造力,维护等的应用程序,并通过单个无广告订...
  • Stability AI text-to-speech models
    Stability AI text-to-speech models Stability AI 高保真文本转语音模型旨在提供对大规模数据集进行训练的语音合成模型的自然语言引导。它通过标注不同的说话者身份、风格和录音条件来...
  • Fini AI
    Fini AI Fini AI是一个强大的自助式、24/7互动聊天工具,通过训练知识库与知识库链接,帮助您更好地与用户交流并留住更多用户。不需要集成,只需添加知识库链...