DeepRAG是什么?一文让你看懂DeepRAG的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

DeepRAG概述简介

DeepRAG 是中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成(RAG)框架,提升大型语言大模型(LLMs)在推理和检索任务中的性能。通过将检索增强推理建模为马尔可夫决策过程(MDP),引入“检索叙事”和“原子决策”两个关键组件,实现了结构化和自适应的检索流程。DeepRAG 的核心在于动态决策:模型在每一步会根据当前状态决定是否检索外部知识,或者仅依赖自身的参数知识进行推理。

DeepRAG的功能特色

动态检索决策:DeepRAG能动态决定在每一步是否需要检索外部知识,或者仅依赖模型自身的参数知识进行推理。避免不必要的检索操作,提高了检索效率,同时减少了噪声和推理延迟。

结构化检索流程:通过引入“检索叙事”(Retrieval Narrative),DeepRAG确保检索过程是结构化和自适应的。模型会根据之前检索到的信息生成新的子查询,逐步推进推理过程,更好地处理复杂查询。

知识边界校准:DeepRAG通过“校准链”(Chain of Calibration)方法,帮助模型更准确地识别自身知识的边界。模型能更好地判断何时需要检索外部知识,可以依赖自身的知识进行推理,提高答案的准确性和可靠性。

提高检索效率和答案准确性:实验表明,DeepRAG在多个开放域问答数据集上显著提高了答案的准确性(平均提升21.99%),同时减少了检索次数,优化了检索效率。

泛化能力和鲁棒性:DeepRAG在时间敏感和分布外的问答任务中表现出良好的泛化能力和鲁棒性,能适应不同的问答场景和数据分布。

DeepRAG的技术原理

马尔可夫决策过程(MDP)建模:DeepRAG 将检索增强推理过程建模为 MDP,表示对原始问题的部分解决方案。状态 st​ 包括输入问题 x 和到目前为止的子查询及其中间答案。包括两个子决策:

终止决策(Termination Decision):决定是否继续生成下一个子查询,或者直接生成最终答案。

原子决策(Atomic Decision):决定是否检索外部知识,或者仅依赖模型的参数知识。

转移(Transitions):根据动作更新状态。如果决定检索,模型会检索相关文档并生成中间答案;如果决定不检索,则直接生成中间答案。

奖励(Rewards):基于答案的正确性和检索成本评估状态。奖励函数最大化答案的正确性,同时最小化检索成本。

二叉树搜索(Binary Tree Search):DeepRAG 使用二叉树搜索方法为每个子查询构建推理路径。对于每个子查询,模型生成两个分支:一个分支基于参数知识直接生成答案,另一个分支通过检索外部知识生成答案。通过这种方式,模型探索不同的检索策略,生成从初始问题到最终答案的完整推理路径。二叉树搜索能分解问题,彻底检查检索选择对最终答案的影响。

模仿学习(Imitation Learning):模仿学习的目的是让模型学习有效的检索模式。使用优先队列高效探索潜在的推理轨迹,优先选择检索成本较低的路径。通过二叉树搜索合成数据,提取到达正确最终答案的推理过程。使用合成数据对模型进行微调,提高其终止决策和原子决策的能力,同时增强查询分解和生成可靠中间答案的能力。

校准链(Chain of Calibration):校准链方法进一步优化模型对自身知识边界的认知。通过合成偏好数据确定何时需要检索。数据基于最优路径生成,指示每个子查询的首选检索策略。使用这些偏好数据对模型进行微调,增强其基于内部知识边界的原子决策能力。通过校准链方法,模型能更准确地识别何时需要检索外部知识,可以依赖自身的知识进行推理。

DeepRAG项目介绍

arXiv技术论文:https://arxiv.org/pdf/2502.01142

DeepRAG能做什么?

开放域问答:DeepRAG能处理复杂的多跳问答任务,通过逐步分解问题并动态检索相关信息,生成准确的答案。

知识库问答:在知识库问答中,DeepRAG可以结合外部知识库(如维基百科)和模型自身的知识,提供更准确的答案。

智能客服与虚拟助手:DeepRAG可以应用于智能客服系统,通过动态检索和推理,提供更准确、更及时的客户支持。

教育与学习辅助:在教育领域,DeepRAG可以帮助学生和教师获取更准确的知识和信息。根据学生的学习进度和需求,动态生成学习材料和练习题。

医疗健康咨询:DeepRAG可以用于医疗健康咨询,通过检索最新的医学研究和临床指南,提供准确的健康建议。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • Simple Fast Translation
    Simple Fast Translation Simple Fast Translation是一款极其简单的Mac翻译工具,旨在提高工作效率。用户无需复制粘贴,只需选择文本并按下快捷键即可获得准确...
  • Bex
    Bex Bex是一款旨在将团队在Slack中分享的信息转化为可搜索的知识库的在线工具。它通过集成Slack,能够即时回答团队成员的问题,并自动更新文档,确保团...
  • OmniParser V2
    OmniParser V2 OmniParser V2 是微软研究团队开发的一种先进的人工智能模型,旨在将大型语言模型(LLM)转化为能够理解和操作图形用户界面(GUI)的智能代...
  • Supametas.AI
    Supametas.AI Supametas.AI是一款专注于非结构化数据处理的平台,旨在帮助企业快速将音频、视频、图片、文本等多种格式的数据转化为适用于LLM RAG知识库的...
  • Aimfox
    Aimfox Aimfox是一个专为LinkedIn Outreach设计的自动化工具,旨在帮助用户通过个性化的外展活动和简化的潜在客户管理来提升销售效率和成交率。...
  • Fitbuilderr
    Fitbuilderr Fitbuilderr是一款智能健身应用,利用人工智能技术为用户提供个性化的健身计划和营养指导。通过智能语音交互,用户可以向Fitbuilderr询问...
  • BloxGPT
    BloxGPT BloxGPT是一个结合人工智能技术的在线协作白板平台,它通过AI的辅助,使得用户能够在一个共享的数字空间内进行创意思考和团队协作。该平台支持多种工具...
  • JsRates
    JsRates JsRates是一款用于定制化运费计算的创新型Shopify应用,通过JavaScript提供了商家无与伦比的灵活性和控制力,为其独特的业务需求设计定...