电信网络中的AI原生定义

我们已经讨论了 AI 如何为服务提供商带来商业价值 1 以及 BSS 如何向 AI 原生发展。本白皮书深入探讨了新出现和讨论的 AI 原生概念,该概念目前仍没有明确的定义。

读者将了解如何定义 AI 原生,并将介绍一种工具,即 AI 原生成熟度矩阵,以判断产品在 AI 原生成熟度等级上的位置。AI 原生成熟度矩阵进一步帮助专家规划他们的 AI 原生之旅。

1、AI 原生概念的出现

在过去十年中,AI 和机器学习 (ML) 技术的开发和使用呈爆炸式增长,特别关注 AI 领域的 ML 方面,其中 ML 通常被视为 AI 的一个子领域。这也是本文中使用这些术语的方式。使用“AI”一词时,应理解大部分 AI 讨论都围绕 ML 子领域展开,但 AI 并非仅限于 ML,在 AI 的其他方面(例如机器推理)仍有大量工作要做。

目前,AI 技术已经成熟,现在被认为是稳定的,最先进的技术被用于解决许多类型的难题。AI 技术在存在固有随机性和不确定性的情况下表现出色,并且在可用数据中捕获模式和相关性的复杂性(有时基于非常复杂的输入)需要付出大量努力才能被人类专业知识所驯服。在这些情况下,AI 技术可以在可用数据上进行训练,然后学习表示和预测数据中的固有行为。

在电信领域,人们已经观察到 AI 在多种用例中的相关性日益增加,这种情况已经持续多年。电信行业采用基于人工智能的解决方案有多种驱动因素,这种相关性也体现在标准化方面,但不仅仅是标准化,例如 3GPP 的 5G 和 5G Advanced 规范,其中基于人工智能的解决方案越来越多地用于改善网络性能和实现智能网络自动化。

这些事实加在一起,使人工智能成为电信行业的普遍技术,也催生了“人工智能原生”一词,该术语已开始出现在学术界和行业讨论中。

随着人工智能的作用不断增强,它将对电信系统的设计和处理产生更显著的影响。 另一方面,到目前为止,尚不清楚人工智能原生的多面性对电信运营商或通信服务提供商 (CSP) 意味着什么,以及他们应该如何规划其网络的发展。 还缺乏一个明确的定义来帮助巩固人工智能原生的概念,并就人工智能原生的含义以及它对整个行业的重要性达成共识。

2、AI 原生的定义

为了解决 AI 原生这一术语缺乏明确定义的问题,首先必须明确该术语的使用方式。AI 原生通常用作系统、功能或实现等实体的前缀,例如,更具体的实体,如特定功能或接口。无论前缀用于哪个实体,可以说 AI 原生的高级概念保持不变,它包括实体所有子组件中 AI 的广泛使用和所需的附带数据基础设施,而不是将基于 AI 的组件添加到现有的非基于 AI 的实体。

在讨论最广泛意义上的概念时,使用 AI 原生实现这一术语来消除语言歧义。谈论系统、功能(可以是一般意义上的功能,也可以是网络功能)或应用程序会令人困惑,因为所有这些都可以是 AI 原生的。相反,将使用通用术语实现,该术语将涵盖上述所有内容以及可以被视为 AI 原生的任何其他可以想象的实体。

从实施角度来看,向系统添加 AI 功能有不同的方法:

图 1:向系统添加 AI 的方法

上图直观地展示了几种不同的方法。

第一种方法是使用 AI 技术替换、实现或增强现有功能。这已经在爱立信产品中实施了相当长一段时间,例如用于 ML 辅助寻呼的移动管理实体 (SGSN-MME) 产品,以及 RAN 功能,例如增强型 MIMO 睡眠和 AI 驱动的下行链路自适应。

第二种方法是添加一个全新的基于 AI 的组件,该组件没有任何相应的旧实现。一些现有示例包括 AI 驱动的能源优化器和 5G 感知流量管理。

第一种方法和第二种方法都需要与现有系统实现向后兼容,即与第一种方法中的旧接口兼容,与第二种方法中新引入的(或预先存在的)接口兼容。

第三种方法是添加一个基于 AI 的组件,作为旧组件的控制。基于 AI 的控制在传统功能的基础上提供了自动化、优化和/或额外功能,例如 AI 驱动的高级单元监控。

仅仅使用 AI 替换现有功能或在一个或多个或所有组件中添加新功能,并不能使实现成为 AI 原生。AI 原生实现由 AI 感知控制组件管理,这些组件本身可以使用 AI 技术实现,包括用于管理基于 AI 的组件生命周期的功能。在此基础上,现在可以引入 AI 原生概念的定义:

“AI 原生是指具有内在可信赖的 AI 能力的概念,其中 AI 是功能的一个自然组成部分,无论是在设计、部署、操作还是维护方面。AI 原生实现利用数据驱动和基于知识的生态系统,其中数据/知识被消费和生成以实现新的基于 AI 的功能,或者在需要时用学习和自适应 AI 增强和替换静态、基于规则的机制。”

3、电信环境中的 AI 原生

要使 AI 原生有意义,需要提供额外的支持和条件。为了正确看待 AI 原生,AI 原生的环境根据下图可视化:

图 2:电信环境中的 AI 原生
  • 目的

这是给定 AI 原生实现要实现的目标。通常,即使拥有深厚的领域知识,也需要使用非 AI 实现的非常复杂的解决方案,但可以使用表示系统行为的数据来训练基于 AI 的解决方案。例如,利用 AI 实现零接触操作愿景、RAN、核心或管理域中的各种功能增强和优化,或其他类型的非功能优化,如功率效率、延迟和吞吐量优化等。

  • 环境

环境代表 AI 原生系统周围的环境。 AI 原生实现需要了解环境条件,并能够利用它们实现自己的目的,能够检测和适应任何可能对其自身执行目的的能力产生影响的变化。这可以是检测它与哪些类型的数据库和协议交互、它在哪种类型的硬件平台上执行或它处于哪种类型的无线电环境中。

  • 智能

智能代表能够主动将自己的基础知识与新观察结果相结合的能力,通过适应变化的情况(例如,在环境中)并用新获得的理解扩展其知识库,最后通过随着时间的推移学习新知识来发展实现目标的策略和措施。

  • 系统

系统处理基于 AI 的功能的所有生命周期管理,它代表 AI 原生实现与其邻居交互并以 AI/分析友好的方式生成和公开数据和知识的能力。系统确保所有操作的可信度、公平性和可解释性,并实施 AI 安全和 AI 控制机制。整个系统实现了整个网络的协作智能。

  • 结果

最后,AI 原生实现的结果代表了增值功能的实现,例如认知自主网络视觉、基于衍生知识和推理的自主行动,以及采用当前和未来的以 AI 为中心的架构。

4、AI 原生架构

AI 原生背景下的一个重要目标是以 AI 为中心的架构。但什么是 AI 原生架构?根据上述 AI 原生概念的定义,可以得出结论,它是一种 AI 贯穿整个架构的架构。这可以通过从一开始就规划 AI 原生架构来实现。对于旧产品,如果某些方面得到适当解决,可以将现有系统(在商业上有意义的情况下)发展为 AI 原生系统。

但 AI 原生将如何在架构中体现?这很难回答,因为它取决于架构的类型。例如,与部署架构相比,AI 原生性在功能架构中的表现会有所不同,功能架构捕获要支持哪些功能以及这些功能如何交互,而部署架构捕获在何处执行功能和运行 AI 模型,以及放置此类 AI 模型和相应功能的物理位置之间存在哪些交互。

为了回答这个问题,本文涵盖了与 AI 原生架构相关的以下方面:1)无处不在的智能;2)分布式数据基础设施;3)零接触; 4) AIaaS。

无处不在的智能涵盖了这样的要求:根据成本效益分析,应能够在任何合理的地点执行 AI 工作负载。这意味着,在每个网络域、堆栈的每一层、从中央到边缘站点的每个物理站点,甚至可能在移动设备上。这也意味着 AI 执行环境需要在任何地方可用,如果需要,AI 训练环境可以共置。

下图说明了这个想法。今天,已经有几种 AI 模型投入生产。预计 AI 模型的数量将会增加。最终,数量将如此之大,以至于模型生命周期管理不能再仅通过部分自动化支持来完成。相反,它需要完全自动化,业务逻辑决定使用哪个模型版本进行执行以及在何时何地执行模型(重新)训练。具有相似输入特征的模型可以组合在一起。模型可能需要跨越多个层甚至多个域的数据,这可能意味着层和域的边界变得模糊。换言之,模型生命周期管理的目的是使AI原生架构具有协调、可信的智能,不断改进和跟踪数据变化,实现全系统的端到端增益。

图 3:架构中无处不在的智能

无处不在的智能与分布式数据基础设施相互关联。只有当数据和必要的计算资源(例如 GPU)随处可用时,才能在任何地方执行和(在需要时)训练 AI 模型。如果数据随处可用,它还将使模型能够跨越当今的层次和领域边界。换句话说,AI 原生对数据基础设施有很强的要求。

数据可能有最佳保质期或法律约束。庞大的数据量可能会设置约束。这将限制何时何地可以使用数据。可能需要处理数据流,或者可能需要组合多个数据流。数据可观测性需要灵活,以适应数据消费者的要求以及数据生产者和传输基础设施的可用资源。所有这些都意味着数据基础设施和模型编排器需要交互;有时数据可以传输到智能,有时将智能更接近数据会更有效,例如当对数据的时间有严格要求时,数据在一定时间后就无用了。数据提取架构6 中提供了更详细的描述。我们预计这种架构将随着时间的推移而进一步发展。

上述两个方面意味着需要实现许多功能。例如数据可观测性、数据预处理、特征工程、模型训练、模型存储库、模型服务、模型漂移检测、执行监控等。所有这些功能都可以在 AI 原生网络架构中使用,从而实现 AI 工件的生命周期管理,即模型、管道、特征、数据集等。这方面通常称为 AIOps 或 MLOps。

从上面可以看出,无处不在的智能意味着 AI 技术可以在整个架构中以跨领域的方式使用,而不仅限于架构的某一层。数据基础设施也是如此;数据和知识需要跨层共享,AI技术可以应用在各层,甚至跨层。

图 4:通用 AI 原生架构

管理上述智能和数据基础设施使人类操作员的任务变得更加复杂。需要自动化 AI 和数据的管理。目标应该是完全自主的操作,而不是引入新的手动操作(人类决定做什么和如何做)或自动化操作(人类设计工作流程执行)。人类仍然可以通过向系统表达要求并监督这些要求得到满足来掌控,而不是指示系统采取什么行动。我们称此方面为零接触。引入零接触来管理 AI 和数据甚至可能成为完全自主网络的推动者,其中自主网络是具有自我*(自我配置、自我修复、自我优化、自我保护)能力的网络。这使得认知网络2成为可能,即自主网络的 AI 原生实现。7 中提供了有关创建自主网络的更详细描述。

最后,上述 AI 原生架构方面需要在网络中提供与 AI 和数据处理相关的新功能。其中一些功能可能会作为服务向外部方公开。示例包括 AI 模型生命周期管理功能(例如训练或执行环境)或数据处理方面(例如数据公开)。公开此类服务将网络变成创新平台。这些 AI 服务的公开通常称为 AI 即服务 (AIaaS);AIaaS 的用户可能是服务提供商,甚至是服务提供商的客户。

5、AI 原生成熟度模型

在探索了 AI 原生的背景及其对架构的影响之后,如何设计 AI 原生系统,或者如何在合理的范围内将现有实现演变为 AI 原生实现?换句话说,如何为电信行业的 AI 原生之旅定义参考框架?

在本节中,专家将获得一种工具来评估他们的产品在 AI 原生频谱中的位置,并规划实现如何向 AI 原生发展。专家们还了解了开发旨在成为 AI 原生的产品的背景。

指导原则是增加 AI 原生实现的跨度和自主性,同时减少人为干预和控制的水平。因此,虽然在初始阶段,人工智能只是在严格的人类指导和修订下取代基本功能,但此后,人工智能越来越成为实施的核心,人类只关注指定目标和监控输出。

为了帮助指导专家踏上人工智能原生之旅,爱立信开发了一个人工智能原生成熟度模型。与许多其他人工智能成熟度模型不同,该模型侧重于人工智能原生方面,而忽略了许多其他方面,例如战略和财务、人员管理、培训和文化、治理以及其他与开发人工智能系统相关的人工智能相关方面。该模型由一个五级矩阵组成,另外还有零级,表示不是人工智能原生,每个级别都有几个维度。可以根据人工智能原生程度分析架构、协作、数据提取等维度。

图 5:AI 原生成熟度模型

具有不同级别的列应被视为一种测量工具,而不是绝对目标,因为对于所有 AI 原生实现来说,达到级别 5 并不一定有意义,因为每个实现的要求不同。

模型中的行是独立的,因此给定的实现可以在一个维度上处于级别 2,在另一个维度上处于级别 3。每个应用程序都可以选择,例如,在数据管理上要求级别 3,但在自我维度上满足级别 1。

AI 原生成熟度模型最初可用于建立产品在 AI 原生旅程中的位置的基线评估。然后,它可以进一步用于设定 AI 原生性的目标以及如何实现该目标的里程碑。

当根据业务需求决定了适当的实施目标级别时,可以从基线评估开始使用该模型,并将不同维度的进一步步骤映射到时间线上。然后可以概述一个进化故事,以随着时间的推移达到所需的 AI 原生性水平。

为了使实现达到最低水平的 AI 原生性,它至少应在架构、数据提取、存储和处理、模型生命周期管理 (LCM) 和安全性以及自我*维度上达到 1 级。也就是说,必须有一个定义明确的(基本)架构,用于 AI 设施和机制来部署和管理 AI 模型,以及模型从周围环境中提取所需数据。还需要能够随时监控模型的行为。

道德、可信度和安全等主题至关重要,它们在所有 AI 实现中都发挥着非常重要的作用,并且在世界各地各不相同。因此,成熟度模型并未特别涵盖这些方面,因为不希望为给定的实现施加最低或合适的级别,这可能是可接受的,也可能不是,具体取决于系统的部署位置。相反,它选择声明道德、可信和安全的 AI 在所有级别和所有维度上都是强制性的,并且假定所有实现都遵循系统部署地适用的所有监管准则和规则。

6、结束语

在这份白皮书中,定义了不同类型的 AI 实现方法,并揭开了 AI 原生概念的神秘面纱,包括定义。然后阐明了 AI 原生实现的主要方面,并描述了 AI 原生将如何在架构中呈现,然后详细解释了 AI 原生级别,这些级别可作为电信行业在其 AI 成熟度之旅中的指导方针。这些级别补充了不同标准化论坛 15 现有的 AI 成熟度模型,因此,向前迈出的宝贵一步可能是在不同的论坛上评估这个框架,以达成全行业的共识。

理想情况下,AI 原生实现意味着 AI 是作为系统中的第一个想法而不是事后的想法来实现的。换句话说,该系统旨在利用 AI 实现满足不同需求的零接触网络。我们正处于使用最新尖端技术提供变革性产品组合的风口浪尖,并逐步向 AI 原生架构发展。对于行业来说,团结起来并根据需要利用和发展 AI 原生技术以实现规模化采用至关重要。

CSP 和电信供应商可以利用 AI 原生成熟度模型,并根据他们目前所处的位置和需要去往的方向来设计他们的旅程。作为一个行业,必须非常明确地建立一些术语,其中 AI 原生是最受追捧的术语之一。


原文链接:Defining AI native: A key enabler for advanced intelligent telecom networks

BimAnt翻译整理,转载请标明出处