大模型驱动的智能RPA

从本质上讲，每个企业都是一系列流程的集合。从潜在客户生成和客户获取到财务规划和采购，这些流程相互关联，一个流程的输出为另一个流程提供输入。随着企业的发展，其流程数量也在增加，从而形成了一个错综复杂的数据流和依赖关系网络。

为了帮助管理这种复杂性，企业在 21 世纪初开始采用一种早期的智能流程自动化形式——机器人流程自动化 (RPA)。RPA 允许公司使用软件机器人或“机器人”自动执行重复的基于规则的任务，从而解放人类，让他们专注于更复杂、更有价值的工作。

在最初的日子里，RPA 依赖于基于规则的自动化。这对于简单、结构化的流程很有效，但导致机器人僵化，只能处理具有特定预定步骤的任务。这些机器人通常缺乏人工智能，这意味着它们无法随着时间的推移进行学习、适应或改进。即使 RPA 解决方案确实包含了一些 AI，它们也仅限于处理结构化数据，而大量非结构化的企业数据（如电子邮件、文档和图像）尚未得到利用。据许多分析师估计，非结构化数据占所有业务数据的 80-90%。

这些限制导致 RPA 的采用结果好坏参半。尽管取得了一些早期的成功，但 RPA 未能达到麦肯锡等咨询公司在 2017 年和 2019 年预测的企业范围部署。安永的一项研究发现，30-50% 的 RPA 项目失败，而德勤的一项调查显示，只有 3% 的公司能够成功扩展其 RPA 计划。

人工智能的最新进展有望改变这一现状。通过集成 LLM，机器人获得了强大的新功能，大大扩展了它们的潜在应用，预示着从 RPA 机器人到几乎可以在任何领域与人类一起工作的自主 AI 代理的转变。

在这篇文章中，我们将追溯智能流程自动化的三代发展历程，每一代都以底层技术的进步和用例的不断扩展为标志。从 21 世纪初的基于规则的自动化开始，我们将转向 2010 年代中期的基于云的机器人，最后探索当今新兴的 LLM 驱动的代理。

我们相信，总的来说，LLM 的新颖功能为智能流程自动化提供了市场机会，在未来十年内至少增长 10 倍。这对于专注于人工智能的创始人来说是一个极具前景的领域，尤其是那些在传统上自动化服务不足的领域拥有专业知识的人。

1、第一代RPA - 本地、基于规则的自动化

21 世纪初，RPA 应运而生，由微软和 SAP 等科技巨头引领。这些解决方案专注于自动化后台职能中常见的简单重复性任务，例如输入数据、处理发票、核对财务记录和处理保险索赔。

第一代 RPA 机器人遵循严格的硬编码指令。如果任务偏离了预定义的规则，机器人就会停止工作或在不知不觉中犯错。随着公司的发展和流程的日益复杂，这些基于规则的机器人的局限性变得越来越明显。即使是很小的变化，比如对表单字段的轻微修改，也可能破坏整个自动化工作流程。保持这些 RPA 机器人正常运行需要不断监控、更新和重建。

许多公司将 RPA 视为过时 IT 系统的创可贴。这带来了巨大的集成挑战和成本，因为必须定制机器人才能在旧式软件环境中工作。设置 RPA 解决方案通常需要聘请专业顾问，他们要花费数周或数月的时间规划公司现有的技术堆栈和流程。

这个漫长的设置过程，加上本地基础设施和持续维护的成本，使得组织难以在 RPA 投资上获得高投资回报率。在整个企业范围内扩展这些计划更具挑战性，因为每个新流程或系统都需要自己的定制机器人。

2、第二代RPA：基于云的横向解决方案

到 2010 年代中期，新一代 RPA 机器人进入市场，其特点是基于云的平台。Automation Anywhere、UiPath 和 Zapier 等公司开发了横向解决方案，可以处理跨多个业务功能和软件系统的任务。

这些第二代 RPA 机器人通过捕获流程的业务逻辑并与其他软件工具（如电子邮件客户端、聊天应用程序、云存储服务、CRM 和 ERP 系统）集成来工作。配置完成后，它们可以自动管理请求、协调跨多个系统和团队的工作流程，并确保整个组织技术堆栈的数据一致性。

云计算和 API 的兴起是这种更广泛的 RPA 方法的关键推动因素。基于云的平台允许公司使用 RPA，而无需在硬件和 IT 基础设施上进行大量的前期投资。API 使 RPA 机器人与多个数据库和软件应用程序的连接变得更加容易，从而减少了对自定义集成的需求。基于 API 的自动化也被证明比第一代基于 GUI 的自动化更加稳定和有弹性，因为当界面元素发生变化时，GUI 很容易崩溃。

第二代 RPA 解决方案也开始融入人工智能。这使得机器人能够处理更复杂的任务，这些任务需要一定程度的判断或对非结构化数据的理解。然而，这些人工智能功能的范围往往很窄，仍然严重依赖结构化数据和预定义的工作流程。

3、第三代RPA：LLM 驱动的代理

今天，我们看到了第三代智能流程自动化的兴起，这得益于 LLM 和其他生成式 AI 技术的快速发展。与前几代相比，AI 通常是附加功能或事后想法，而这些新解决方案的核心是生成式 AI。

与第一代和第二代 RPA 机器人相比，LLM 有了重大改进，可以为智能代理提供支持，使其能够掌握上下文、解释用户意图、运用推理做出复杂决策并适应新任务。重要的是，它们可以处理非结构化数据：这一功能开辟了医疗保健、金融服务和法律等垂直行业，这些行业由于依赖与结构化数据库不匹配的数据而难以实现自动化。LLM 还可以根据这些领域的特定数据进行微调，从而使它们能够深入了解每个领域的术语、概念和工作流程。

由于 LLM 可以理解和生成自然语言，因此它们也可以对代码执行同样的操作，从而解锁软件开发和维护中高价值的端到端自动化。生成模型配备了自然语言和图像理解功能，允许代理使用虚拟工具（如按键、鼠标点击和滚动）浏览任何数字环境，包括网站、软件应用程序和数据库。LLM 还可以与 API 交互，使代理可以访问各种软件工具和服务。最终，这将允许用户简单地用简单的文本表达他们想要的目标，而无需指定实现这些目标所需的步骤。

4、垂直特定解决方案的兴起

随着 LLM 驱动的流程自动化不断成熟，我们预计将看到大量 AI 原生、垂直特定解决方案的涌现，这些解决方案可以自动执行日益复杂的认知任务。

Tennr 和 Ikigai 等初创公司已经展示了这种方法的潜力。

Tennr 基于 LLM 的平台简化了医疗实践的后台运营，处理诸如安排患者预约、协调转诊、审计保险索赔、管理医疗记录和发布付款等任务。

Ikigai 专注于改变供应链管理。它使用 LLM 汇总来自不同来源的数据，例如采购订单、车辆跟踪信息和物联网传感器，并提供整个价值链的实时可见性。这使得它的模型能够检测和缓解潜在问题：例如，通过重新安排订单以防止因发货延迟而导致的生产中断或根据预测需求调整生产和库存。

Tonkean 和 Fulcrum 等其他初创公司正在解决采购、金融服务和保险等领域的行业特定挑战。随着这些解决方案的成熟，它们将为几乎所有业务功能和行业带来自动化的新机遇。

在下面的市场地图中，我们概述了每一代智能流程自动化的关键参与者，以及当前这一代我们最兴奋的一些垂直特定机会。

原文链接：Beyond RPA: How LLMs are ushering in a new era of intelligent process automation

BimAnt翻译整理，转载请标明出处