AI 3D建模工具: Tripo 3D | Meshy AI
本文介绍我在 Databricks 上原型化的架构:数据存储在哪里、智能体如何消费它、什么有效、以及哪里有粗糙的边缘。我为那些听过"数字孪生+智能体"宣传并想看到具体组件的数据科学家和 ML 工程师撰写此文:Lakehouse + Lakebase 用于状态、Agent Bricks + Genie 用于 AI,以及 Databricks App 作为面向用户的层。
1、什么是数字孪生?
数字孪生是物理资产、流程、系统甚至整个城市的虚拟复制品。它通过传感器、日志和其他数据源从现实世界对应物获取可能的实时数据,使其能够模拟条件、预测结果并监控性能。
数字孪生不仅仅是一个 3D 模型;它是一个动态的、活的数据结构,支持"假设"场景规划,而不会冒损坏或停机的风险。
智能体的角色
虽然数字孪生提供忠实的模拟,智能体(通常使用大语言模型或其他 AI/ML 技术构建)提供智能。这些智能体与数字孪生交互以:
- 运行模拟: 智能体可能在数字孪生上测试数千种不同的运营参数(例如,更改供应链路线、调整制造温度)以找到最佳设置。
- 预测故障: 通过分析孪生的数据,智能体可以检测预示设备即将发生故障的细微异常,在故障发生前很久就触发维护警报。
- 增强分析: 智能体可以将大量模拟数据综合为可操作的、人类可读的洞察,提供比传统仪表板更深入的系统动态理解。
2、在 Databricks 平台上端到端构建
Databricks 数据智能平台为你提供端到端构建的组件。
2.1 使用 Databricks Lakehouse 和 Unity Catalog 的数据基础
首先将所有实时和历史遥测、IT/OT 数据和上下文业务数据接入数据智能平台作为单一、开放的数据基础。然后在该统一层上使用流处理、分析和 AI 持续建模和模拟你的物理资产和流程。Unity Catalog 在该基础上添加集中治理、血缘和细粒度访问控制,使每个孪生——其数据、模型和输出——都安全且可追溯。
2.2 使用 Databricks Agent Bricks、Genie 和 Lakebase 运营化智能体
- Databricks Lakebase: 数据智能平台上的托管 PostgreSQL 服务。Lakebase 分离计算和存储以处理低延迟 OLTP 工作负载——实时特征服务、AI 智能体状态和应用数据服务。它直接在 Lakehouse 分析和 AI 旁边提供这些功能,消除了手动构建复杂同步管道的需要。
- Databricks Genie Space: Genie Space 是一个无代码聊天界面,让业务用户用自然语言查询数据。它基于策划的 Unity Catalog 数据集和分析师提供的领域特定上下文提供 AI 生成的 SQL 和可视化。
- Databricks Agent Bricks: Agent Bricks 是一个无代码 Databricks 服务,允许团队运营化生产级 AI 智能体。用户定义用例并提供数据;Agent Bricks 自动使用模型选择、微调和提示优化等技术构建、评估和优化智能体系统,全部由 Unity Catalog 治理并使用 MLflow 追踪。
Agent Bricks 中一个有助于增强数字孪生的关键服务是无需代码即可添加 Databricks Supervisor Agent,将多个 Genie Space 和 AI 连接在一起,包括 Databricks Agent Bricks Knowledge Assistant(处理手册和故障排除文档等非结构化文本)。此处的价值在于你可以使用 Supervisor Agent 编排智能体对话的路由,根据业务上下文讨论你提议的模拟并建议解决方案。
2.3 通过 Databricks Apps 交付价值
Databricks Apps 允许你将智能体驱动的洞察转化为可访问、可共享的应用。你的工程师、分析师和决策者可以通过直观的仪表板和自定义工具与数字孪生和智能体建议进行交互,而无需复杂代码。这是降低风险和增强分析的最后一步——将预测能力直接交付给需要它的用户。
案例研究:制造、配送中心和零售供应链数字孪生
我构建了一个 Databricks App,追踪商店产品在供应链中的流转——从制造站点到配送中心,再到全球零售门店。
在 Databricks 上的架构如下:

多个数据流进入 Databricks 托管的 PostgreSQL 解决方案 Lakebase。你可以在 Lakebase 中设置与 Lakehouse 的自动同步按钮。这使得数据出现在典型的 Databricks Lakehouse 中——使智能体(由 Agent Bricks 构建)和 Genie Spaces 可以使用——并向 Databricks App 提供洞察,全部在 Unity Catalog 下治理。Lakebase 实例保存为显示数字孪生的 Databricks App 提供服务的数据。
3、在 Databricks Apps 中可视化数字孪生
设施、物流、运营或移动产品的员工,以及设施和物流内的设备都可以在 Databricks 中制成数字孪生。
下面是一张地图,显示制造设施、配送中心和零售门店之间的路线,以及途中的产品信息。

设施数字孪生有多个设备,包括摄像头、温度传感器、空气质量传感器和移动设备。此外,还有设施的操作员,显示谁在线、他们的安全表现和整体效率。操作员是一个数字孪生,设施的每个设备本身也是数字孪生,聚合在一起帮助构成良好的健康信号并提供设施洞察。你可以从更细粒度的数字孪生中冒泡潜在风险和问题,并应用 AI。

即使是外包物流也值得作为数字孪生来追踪——ETA 遵守情况和在途产品质量都会反馈到整体网络健康中。

如前所述,操作员可以是数字孪生,你可以应用 AI 来帮助识别员工可能需要辅导以提高绩效的地方。

设备数字孪生由传感器数据组成,提供设备健康状况的清晰度,并应用 AI 可以给出预测性维护建议以提高设备可用性和可靠性。

为简单起见,我在这个原型中排除了视频,但非结构化数据——pdf、txt、视频、音频、图像——可以存储在 Unity Catalog Volumes 中并被 AI 使用。在这个原型中,可以对 LLM 进行批量处理调用来查看摄像头图像的质量并识别潜在解决方案。在这种情况下,AI 指出镜头可能需要清洁或重新校准以提高图像质量。

有了这个数字孪生,智能体可以实时排查传感器异常,并在设备故障或进一步恶化更大的运营用途之前触发预测性维护工作流。
所有这些传感器、设备、设施和操作员都是整体流程的一部分,可以将数字孪生融合在一起以获得更好的洞察。经过该流程的项目也可以是数字孪生,你可以追踪项目是否在可接受的温度范围之外停留了足够长时间以至于未能通过质量检查。这可以输入到良率指标中,并帮助做出改善产品质量的流程决策。

在这里你可以看到,你还可以将财务数据与数字孪生联系起来,以更好地了解产品在整个过程中的价值。
4、智能体使用数字孪生增强分析
AI 智能体需要良好的数据和上下文来帮助运行模拟、预测潜在问题,并自动诊断大量数据中的潜在风险。
上面,我展示了 AI 如何标记传感器异常、与操作员共同诊断问题,并驱动预测性维护工作流——所有这些都反馈到设施和物流绩效中。
这是智能体分析摄像头质量并给出建议的维护提示:

通过按钮按需排查设备故障:

此外,可以使用 AI 在设施或物流数字孪生页面内进行供应链风险分析,以了解不同场景下的潜在风险(例如,自然灾害袭击 A 地区,如何影响门店产品可用性?)。

最后,我制作了一个聊天界面,你可以询问运营和产品质量的变化如何影响财务,以及如何避免这些风险。

5、我学到的
构建这个过程中有几件事让我惊讶:
- 数字孪生思维有帮助——将每个业务组件视为数字孪生,甚至到最底层,是确保你的智能体拥有扩展分析所需数据的绝佳模型。
- Lakebase 和 Unity Catalog——目前 Lakebase 的成熟度方面,Lakebase 和 Lakehouse 的访问控制和角色必须独立建立。基本上 Lakebase 在 Unity Catalog 安全治理之上添加了额外的安全层。
- Databricks Apps 允许你代表用户将凭证传递给 Databricks——Databricks Apps 可以代表活跃用户操作,因此,Databricks Lakebase 内的数字孪生数据访问由单个用户权限严格治理,允许执行细粒度访问控制,包括行级安全。
6、我会做不同的
我会从 Lakebase 中的数据开始,然后与 Lakehouse 同步,而不是我最初做的从 Lakehouse 同步到 Lakebase。在这个场景中,Lakebase 到 Lakehouse 的同步是实时解决方案的更优选择。
7、我实现了目标吗?
是的,原型架构成功演示了在 Databricks Lakehouse 上构建和治理的、带有 Lakebase 的数字孪生,可以为 LLM 智能体提供足够的上下文数据来执行诊断传感器异常、评估供应链风险和从统一数据层回答财务影响问题等有用任务。
原文链接: Digital Twins + Agents: An End-to-End Architecture I Prototyped on Databricks
BimAnt翻译整理,转载请标明出处