YAYI-Ultra是什么?一文让你看懂YAYI-Ultra的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

YAYI-Ultra概述简介

YAYI-Ultra (雅意)是中科闻歌研发的企业级大语言大模型的旗舰版本,具备强大的多领域专业能力和多模态内容生成能力。支持数学、代码、金融、舆情、中医、安全等多个领域的专家组合,能缓解垂直领域迁移中的“跷跷板”现象。YAYI-Ultra 支持最长128k的输入和更长的上下文窗口,具备1000万+图文数据对齐的多模态能力。支持多轮对话角色扮演、内容安全风控以及10+智能插件调用。

YAYI-Ultra的功能特色

多领域专业能力:YAYI-Ultra 是混合专家模型,支持数学、代码、金融、舆情、中医、安全等多种领域专家组合,缓解稠密模型在垂直领域迁移过程中普遍存在的“跷跷板”现象。

多模态内容生成:支持图文并茂的输出,能根据用户的问题从知识库中提取相关信息,同步给出对应的图片内容。

超长文输出:支持最长20万字输入和10万字超长输出,形成从“输入理解”到“内容创作”的全链路长文本能力闭环。

数据分析与可视化:能准确完成数据分析、计算和图表绘制任务。

复杂任务智能规划:YAYI-Ultra 增强了多工具串行调用场景下的规划合理性,能将复杂任务拆解为多个子任务,通过调用搜索引擎、代码解释器、图像解析等基础工具,以及新闻热榜追踪、传播影响力分析等垂直领域工具来完成任务。

联网智能创作:支持联网收集信息完成创作,例如写一篇关于中国儒家文化发展历史的分析报告。

YAYI-Ultra的技术原理

混合专家架构:YAYI-Ultra 采用混合专家模型架构,支持多种领域专家组合,如数学、代码、金融、舆情、中医、安全等。能显著缓解稠密模型在垂直领域迁移过程中普遍存在的“跷跷板”现象,为不同领域提供高精度、低能耗的智能化解决方案。

指令微调与数据驱动:YAYI-Ultra 的训练基于大规模的高质量多语言语料,结合指令微调技术,在不同领域和任务上表现出色。

YAYI-Ultra的评测表现

在OpenCompass大模型公开学术榜单中,YAYI-Ultra以64.5分首次闯入前十,成为TOP10中五个中国大模型之一。具体表现如下:

代码生成:在LiveCodeBench中排名第五,表现优于GPT-4o-20241120版本。

复杂指令理解:在IFEval中排名第九。

知识推理能力:在MMLU-Pro中排名第九。

YAYI-Ultra项目介绍

Github仓库:https://github.com/wenge-research/YAYI2

HuggingFace模型库:https://huggingface.co/wenge-research

YAYI-Ultra能做什么?

媒体领域:帮助客户将内容创作时间缩短30%-50%,内容发布频率提升20%-40%,内容差错率从5%降至0.5%左右。

医疗领域:基于YAYI的大医金匮中医大模型,可精准诊断500余种常见病症,辨证推理准确率高达90%,并面向C端用户推出了“大医金匮”中医健康管理APP。

财税领域:基于YAYI的财税知识大模型,模型回答准确率90.1%,高于其他同类型模型,客户实现24小时不间断的咨询服务。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • AI Timeline
    AI Timeline AI Timeline是一个以时间线形式展示人工智能发展历史的教育性网站。它通过互动的方式,让用户能够直观地了解人工智能技术的发展脉络,包括重要的里程...
  • uRace
    uRace uRace是一款将日常运动转化为游戏的移动应用,通过游戏化挑战激励用户参与跑步、骑行、游泳和徒步等运动。它不仅是一款健身追踪器,更是一种免费、有趣的方...
  • Chai Discovery
    Chai Discovery Chai Discovery是一个专注于解码生命交互的网站,它可能涉及生物信息学、基因组学或相关领域,旨在通过先进的技术手段揭示生命体之间复杂的相互作...
  • rizz lines ai
    rizz lines ai 使用Rizz Lines AI,AI驱动的助手来增强您的约会游戏,该助手生成平滑的拾音器线,聊天响应和约会内容。节省时间并用科学制作的内容留下深刻的印...
  • MediaFlows
    MediaFlows MediaFlows 是开发人员使用的低代码平台,可在几分钟内自动化视觉媒体相关的工作流。它提供了丰富的功能,包括使用 AI 摘要视频、使用 AI 生...
  • CyberHost
    CyberHost CyberHost是一个端到端音频驱动的人体动画框架,通过区域码本注意力机制,实现了手部完整性、身份一致性和自然运动的生成。该模型利用双U-Net架构...
  • Summarize.One
    Summarize.One Summarize.One是一款能够快速总结语音消息的工具,用户可以通过将语音消息转发至Summarize.One的WhatsApp聊天中,即可立即获...
  • C知道
    C知道 C知道是由CSDN和外部合作伙伴联合研发的生成式AI产品,专注于为程序员提供问答、对话、文件分析、代码生成等服务,旨在提高工作学习效率。它通过先进的人...