RIG:检索交错生成

假设你是一名金融分析师,试图对法国目前的 GDP 和意大利的 GDP 进行详细比较。你向语言模型提交查询,询问

“法国和意大利目前的 GDP 数字是多少,它们在过去五年中发生了哪些变化?”

使用检索增强生成 (RAG),该模型执行初始检索步骤,从外部数据库或知识源获取相关数据。收集这些信息后,该模型会生成响应,例如:

“法国目前的 GDP 约为 2.9 万亿美元,而意大利的 GDP 约为 2.1 万亿美元。在过去五年中,法国的 GDP 平均增长了 1.5%,而意大利的 GDP 保持相对停滞,增长率为 0.6%。”

在这种情况下,RAG 通过一次性检索过程将其基于现实世界的数据,然后生成最终输出,从而有效地改进了模型的响应。

但是,如果需要更复杂、不断发展的查询,尤其是需要动态检索多条实时信息时,此过程可能会受到限制。

这就是检索交错生成 ( RIG ) 的意义!!!

现在想象一下你提出一个更复杂的查询:

“过去五年,法国和意大利的 GDP 增长率是多少,与同期的就业率相比如何?”

使用 RIG,该模型首先根据其内部了解的 GDP 数据生成部分响应。 但是,它不依赖于单个检索步骤,而是交错检索就业率数据,同时继续生成文本。 例如,当模型提供初始 GDP 数据时,它会同时获取就业统计数据并实时更新其响应:

“法国目前的 GDP 为 2.9 万亿美元,而意大利的 GDP 为 2.1 万亿美元。 在过去五年中,法国的 GDP 平均增长率为 1.5%,意大利的 GDP 平均增长率为 0.6%。在此期间,法国的就业率增长了 2%,而意大利的就业率仅略有改善,为 0.5%。”

那么究竟发生了什么?

RIG 通过在生成文本时不断获取相关数据来增强响应,为复杂、多方面的查询提供更全面、更准确的响应。这种动态交错确保每条信息都是最新的、事实正确的,尤其是在实时数据场景中,为决策提供更精确的见解。

让我们进一步了解 RIG!

1、但首先……什么是交错?

在我们进入 RIG 之前,了解交错的概念至关重要。

交错(Interleaving)是一种用于计算、调度和数据检索等各个领域的技术,其中多个任务、流程或数据流以允许它们同时或并行进行的方式交替或组合,而无需按顺序完成每个任务。

简而言之,它是关于混合不同的操作,而不是在开始另一个操作之前完成一个操作。

交错示例

在检索交错生成 (RIG) 的上下文中,交错是指在生成部分响应和检索外部数据之间交替。该模型不会等待所有数据都被检索后再生成其响应;相反,它将两个任务交错,因此检索和响应生成并排进行。

2、什么是检索交错生成 (RIG)?

检索交错生成 (RIG:Retrieval Interleaved Generation ) 是自然语言处理 (NLP) 中的一种高级技术,其中实时数据检索与大型语言模型 (LLM) 的响应生成动态结合。

RIG 不是在生成响应之前检索外部数据的线性过程(如检索增强生成 (RAG)),而是将检索集成到生成过程本身中。它允许 LLM 在生成部分响应的同时不断查询外部数据源,在检索和生成之间进行迭代。

RAG 与 RIG 的实际操作

3、RIG 如何工作?

RIG 的过程可以分为几个关键步骤:

1️⃣ 用户查询提交:用户向 LLM 提交查询或提示,就像在传统语言模型交互中一样。

2️⃣ 部分响应生成:LLM 开始根据其已有的内部知识生成响应。但是,此响应可能包含需要外部数据部分的占位符或推测性答案。

3️⃣ 实时数据检索:当 LLM 识别出缺失或不完整的信息时,它会实时查询外部来源(例如数据库、知识图谱或基于 Web 的 API)。该模型可以进行多次检索调用,用新获取的数据丰富响应。

4️⃣ 检索和生成的交错:在生成响应的过程中,模型会根据需要动态地交替生成响应的各个部分和获取数据。例如,如果 LLM 以“加利福尼亚州的人口大约为……”开头,它会暂停以检索特定的人口数字,然后再完成该部分响应。

5️⃣ 最终响应:检索并合并所有必要数据后,LLM 会完成响应并将其返回给用户。

想象一下这样的查询:“美国目前的 GDP 是多少,与中国相比如何?”

  • 初始生成:LLM 可能以“美国的 GDP 约为……”开头
  • 检索:然后,LLM 查询可信数据源(如世界银行或 IMF 数据库)以检索最新的 GDP 数据。
  • 交错:当 LLM 生成查询的比较部分时,它会检索中国 GDP 的实时数据以确保准确的比较。
  • 最终回复:在完成两个国家的检索过程后,LLM 最终确定完整的、基于数据的回复。

4、RIG 最新研究:Google DataGemma

2024 年 9 月,Google 推出了 DataGemma,这是一款旨在解决 LLM 幻觉问题的革命性解决方案。DataGemma 试图通过使用 Google Data Commons 的大量资源将 LLM 输出锚定在现实世界的统计数据中来解决这一问题。通过将响应建立在经过验证和可信的数据源中,DataGemma 旨在提高 AI 生成内容的准确性和可靠性,使其更适合高风险应用程序。

Data Commons 是一个公开的知识图谱,包含数十万个统计变量中的超过 2400 亿个丰富数据点。它从联合国 (UN)、世界卫生组织 (WHO)、疾病控制和预防中心 (CDC) 和人口普查局等值得信赖的组织获取这些公开信息。将这些数据集组合成一套统一的工具和 AI 模型,可以帮助政策制定者、研究人员和组织寻求准确的见解。” — 谷歌,2024 年

谷歌推出了两种专门为增强大型语言模型功能而设计的高级变体:DataGemma-RAG-27B-IT 和 DataGemma-RIG-27B-IT。这些模型代表了检索增强生成 (RAG) 和检索交错生成 (RIG) 的最新进展。

  • RAG-27B-IT 模型利用谷歌庞大的数据共享资源,使其能够将丰富的上下文驱动信息整合到其输出中,使其成为需要深入理解和深入分析复杂数据集的任务的理想选择。
  • 同时,RIG-27B-IT 模型专注于从可信来源实时检索数据,以在响应生成过程中动态地核实和验证统计信息,确保高准确性。

这两种模型都是为要求精确和推理的任务量身定制的,特别适合研究、政策制定和业务分析应用。

尽管 RIG 和 RAG 方法仍处于早期阶段,但初步研究表明,在处理数值事实时,LLM 的幻觉准确性和减少幻觉的几率有望提高。

5、为什么要使用 RIG?

1️⃣ 减少 LLM 中的幻觉(甚至比 RAG 还要多)

通过将实时数据检索与生成过程交错,RIG 在形成响应时不断查询可信数据源。它有助于模型将其输出建立在现实世界的事实信息中,从而显着降低幻觉的风险。

例如,当被问及特定统计数据或实时数据时(例如,“2023 年巴西的 GDP 是多少?”),RIG 可确保响应基于从可靠数据库检索到的当前数据,从而减少对内部存储的过时或不完整信息的依赖。

2️⃣ 提高准确性

RIG 的显著优势之一是它能够为依赖数据的查询提供更准确的响应。在传统的 LLM 中,模型只能根据其在预训练阶段学到的知识生成答案。如果内部知识过时,模型可能会生成错误的答案。RIG 通过在生成过程中获取实时数据来解决这个问题,确保其提供的信息的准确性。

例如,在与金融相关的查询中,例如“10 年期债券的当前利率是多少?”,RIG 会在最终确定响应之前实时从金融数据库中检索最新数据,从而提供准确且最新的答案。

3️⃣实时适应

RIG 的一个显着优势是它能够在生成响应时实时适应。与检索增强生成 (RAG) 不同,在生成响应之前仅检索一次数据,而 RIG 会在响应生成期间动态交错检索过程。如果 LLM 遇到多条缺失或不完整的信息,它可以迭代地获取数据并完善其响应。

例如,用户提出一个复杂的多部分问题,如“法国的 GDP 是多少,最近的经济政策对其有何影响?”。RIG 可以首先检索 GDP 数据,开始生成响应,然后动态检索有关经济政策的信息并将其集成到最终输出中。

6、RIG 的实际应用

RIG 用途广泛,非常适合处理需要多个数据源的复杂、实时或不断发展的查询。RIG 适用于信息不断变化和发展的行业。RIG 能够交错检索和生成,非常适合精度至关重要的情况。

RIG 在以下领域非常方便:

  • 医疗保健:获取实时患者数据、临床试验结果和最新医学研究,以提供准确的医学见解。
  • 金融:检索实时股票价格、利率或经济指标,以提供及时的财务见解。
    科学研究:提供最新的研究成果,并在收集更多数据时动态调整响应。
  • 客户支持:根据实时产品或政策信息提供准确的响应。

7、RIG 的挑战和局限性

RIG 前景光明。但是,它受到一些挑战的限制,包括:

  • 延迟:由于持续检索而导致响应时间增加。
  • 资源强度:RIG 的交错过程可能需要更多的计算资源和令牌。
  • 数据依赖性:外部数据源速度慢、不可靠或不完整时面临的挑战。
  • 实施复杂性:需要更复杂的架构和设计。

8、RIG 的未来

检索交错生成 (RIG) 的未来为进一步的 AI 研究和开发提供了令人兴奋的潜力。随着实时数据对各个行业变得越来越重要,RIG 有望不断发展并与实时数据库更好地集成。

随着 AI 模型越来越多地与现实世界的数据交互,我们可能会看到 RIG 集成到自主代理中,使这些系统能够在需要实时决策和数据驱动洞察的环境中自适应地做出响应。物流、机器人或客户服务中的自主系统可以从这种自适应检索过程中受益匪浅,即时提供高度情境化和准确的响应。


原文链接:Retrieval Interleaved Generation (RIG): When real-time data retrieval meets response generation

BimAnt翻译整理,转载请标明出处