DeepRAG是什么?一文让你看懂DeepRAG的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

DeepRAG概述简介

DeepRAG 是中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成(RAG)框架,提升大型语言大模型(LLMs)在推理和检索任务中的性能。通过将检索增强推理建模为马尔可夫决策过程(MDP),引入“检索叙事”和“原子决策”两个关键组件,实现了结构化和自适应的检索流程。DeepRAG 的核心在于动态决策:模型在每一步会根据当前状态决定是否检索外部知识,或者仅依赖自身的参数知识进行推理。

DeepRAG的功能特色

动态检索决策:DeepRAG能动态决定在每一步是否需要检索外部知识,或者仅依赖模型自身的参数知识进行推理。避免不必要的检索操作,提高了检索效率,同时减少了噪声和推理延迟。

结构化检索流程:通过引入“检索叙事”(Retrieval Narrative),DeepRAG确保检索过程是结构化和自适应的。模型会根据之前检索到的信息生成新的子查询,逐步推进推理过程,更好地处理复杂查询。

知识边界校准:DeepRAG通过“校准链”(Chain of Calibration)方法,帮助模型更准确地识别自身知识的边界。模型能更好地判断何时需要检索外部知识,可以依赖自身的知识进行推理,提高答案的准确性和可靠性。

提高检索效率和答案准确性:实验表明,DeepRAG在多个开放域问答数据集上显著提高了答案的准确性(平均提升21.99%),同时减少了检索次数,优化了检索效率。

泛化能力和鲁棒性:DeepRAG在时间敏感和分布外的问答任务中表现出良好的泛化能力和鲁棒性,能适应不同的问答场景和数据分布。

DeepRAG的技术原理

马尔可夫决策过程(MDP)建模:DeepRAG 将检索增强推理过程建模为 MDP,表示对原始问题的部分解决方案。状态 st​ 包括输入问题 x 和到目前为止的子查询及其中间答案。包括两个子决策:

终止决策(Termination Decision):决定是否继续生成下一个子查询,或者直接生成最终答案。

原子决策(Atomic Decision):决定是否检索外部知识,或者仅依赖模型的参数知识。

转移(Transitions):根据动作更新状态。如果决定检索,模型会检索相关文档并生成中间答案;如果决定不检索,则直接生成中间答案。

奖励(Rewards):基于答案的正确性和检索成本评估状态。奖励函数最大化答案的正确性,同时最小化检索成本。

二叉树搜索(Binary Tree Search):DeepRAG 使用二叉树搜索方法为每个子查询构建推理路径。对于每个子查询,模型生成两个分支:一个分支基于参数知识直接生成答案,另一个分支通过检索外部知识生成答案。通过这种方式,模型探索不同的检索策略,生成从初始问题到最终答案的完整推理路径。二叉树搜索能分解问题,彻底检查检索选择对最终答案的影响。

模仿学习(Imitation Learning):模仿学习的目的是让模型学习有效的检索模式。使用优先队列高效探索潜在的推理轨迹,优先选择检索成本较低的路径。通过二叉树搜索合成数据,提取到达正确最终答案的推理过程。使用合成数据对模型进行微调,提高其终止决策和原子决策的能力,同时增强查询分解和生成可靠中间答案的能力。

校准链(Chain of Calibration):校准链方法进一步优化模型对自身知识边界的认知。通过合成偏好数据确定何时需要检索。数据基于最优路径生成,指示每个子查询的首选检索策略。使用这些偏好数据对模型进行微调,增强其基于内部知识边界的原子决策能力。通过校准链方法,模型能更准确地识别何时需要检索外部知识,可以依赖自身的知识进行推理。

DeepRAG项目介绍

arXiv技术论文:https://arxiv.org/pdf/2502.01142

DeepRAG能做什么?

开放域问答:DeepRAG能处理复杂的多跳问答任务,通过逐步分解问题并动态检索相关信息,生成准确的答案。

知识库问答:在知识库问答中,DeepRAG可以结合外部知识库(如维基百科)和模型自身的知识,提供更准确的答案。

智能客服与虚拟助手:DeepRAG可以应用于智能客服系统,通过动态检索和推理,提供更准确、更及时的客户支持。

教育与学习辅助:在教育领域,DeepRAG可以帮助学生和教师获取更准确的知识和信息。根据学生的学习进度和需求,动态生成学习材料和练习题。

医疗健康咨询:DeepRAG可以用于医疗健康咨询,通过检索最新的医学研究和临床指南,提供准确的健康建议。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • Graphite Reviewer
    Graphite Reviewer Graphite Reviewer是一个AI代码审查工具,它通过即时反馈帮助团队提高代码审查的效率和质量。该工具利用代码库感知AI,自动检测代码中的b...
  • Serendipity
    Serendipity Serendipity是一款Chrome浏览器扩展,旨在保护用户的敏感数据不被意外分享给AI聊天机器人。它能够检测超过25种类型的敏感信息,包括信用卡...
  • 星火绘镜
    星火绘镜 星火绘镜是一款创新的视频创作平台,通过简单的歌词或情节输入,用户能够快速生成个性化的音乐视频和 AI 故事短片。该平台利用先进的 AI 技术,降低了视...
  • 站长团购AI PPT系统
    站长团购AI PPT系统 站长团购AI PPT系统是一款支持一键生成和海量模板的在线建站工具,采用SaaS模式,允许无限多开。该系统基于thinkphp 6.1 + mysql...
  • ai face swap
    ai face swap 与AI面部交换中的照片和视频中的面孔很容易交换。只需将两张照片上传,然后单击“立即交换面”,以快速准确地交换即可。节省时间并使用此高效工具增强视觉内容...
  • polymorf 3d
    polymorf 3d 使用Polymorf 3D -3D会说话的头像发电机创建引人入胜的视觉内容。使用文本或现有音频轻松地使用自定义的化身来叙述您的内容。节省时间,并为您的...
  • Sendsteps
    Sendsteps Sendsteps.ai是最佳的AI演示文稿制作工具,负责内容、设计和互动。每月创建超过23万个AI演示文稿,拥有超过100万用户和领先的企业用户。使...
  • tella
    tella Tella是AI驱动的屏幕录音机和YouTube描述生成器,使您能够快速,精确地为YouTube视频制作优化的描述。 Tella允许您在有或没有成绩单...