AI原生应用的3个特点

NSDT工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - AI模型在线查看 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 - 3D道路快速建模

AI，尤其是大型语言模型，已经变得普遍并融入我们的日常生活。这项技术改变了我们与机器和软件的交互方式。我们已经学会了与机器交谈，与软件和数据建立对话。用户心态的这种转变需要软件设计和构建的相应转变。

很快，“AI 优先”将成为新的“移动优先”心态。聊天机器人、语义搜索、多模式生成特征和其他 AI 功能将成为每个网站的标准。

在本文中，我将探讨“AI 优先”的含义，以及 Unbody 计划如何为非 AI 开发人员创建 AI 原生应用奠定基础。

1、AI 原生的特点

当我们谈论 AI 优先应用或网站时，我们指的是集成 AI 功能或从头开始开发为 AI 原生数字产品的平台。但是，我想为 AI 原生应用提供一个定义。

我相信 AI 原生应用是一种更人性化的软件；一种能够理解我们并适应人类的软件。考虑到这个定义，我将对使应用成为 AI 原生应用的主要支柱进行分类。

1.1 个性化

走向更人性化的软件的第一步是它能够适应和定制我们的个人需求和环境。我说的“我们”是指我们全天所体现的各种角色和角色。例如，我们在工作中的需求与在家时的需求不同。因此，我们与软件和软件本身交互的方式也应该有所不同。在工作中，软件应该根据我们的公司、部门、团队和职位进行个性化设置。在家里，像 Alexa 这样的设备应该适应我们家的温度、大小、日常习惯等。

以聊天机器人应用为例。在工作中，你希望聊天机器人了解你的公司、部门、团队和个人职责。只有这样，它才能有效地搜索你的文档或总结所有“2023 年的财务报告”。

在数字世界中，我们由每天产生的数据足迹代表。这些数据有多种格式，我们需要它来提供更个性化的用户体验。但我们的软件应该如何访问和理解这些数据？

在构建应用程序和网站时，一切都从数据开始。这包括从简单的静态公司网站到提供定制建议以更好地创建简历的复杂 SaaS 产品。传统上，我们使用内容管理系统 (CMS) 以高度结构化的格式创建、整理和管理这些数据。但是，这个过程通常需要大量的手动工作，包括大量的复制、粘贴、手动数据输入和内容分析。

在 AI 原生应用的背景下，我们可以采用不同的数据管理方法。仔细检查任何应用或网站时，很明显，所显示的大部分信息（例如有关页面、常见问题解答部分、博客文章或文档）已经以某种形式存在于其他地方 - 可能是 PDF、Google Doc、markdown 文件或我们发送给其他客户的电子邮件之一。传统上，我们需要重新整理这些内容以满足我们平台的结构化数据要求，同时还要手动应用 SEO 标签、分配关键字、突出显示命名实体以及为图像添加标题。

但是，使用 AI 原生应用，我们可以绕过这些传统步骤。我们不需要重新构建“结构化”和“非结构化”数据来构建网站或应用。相反，我们使用 AI 来省去这种数据转换的麻烦。AI 使我们能够以原始格式和位置维护数据，利用语言模型有效地使其适应我们的需求。

此过程需要能够聚合和处理来自所有不同位置和平台的所有格式的文档、文件和数据。

1.2 情境感知

AI 原生应用的第二个关键方面是内容所处的情境。传统上，所有需要传达的内容都必须明确写出。然而，我们知道每一段内容都具有内在的情境——它不是孤立的，而是与某个时间创建的其他数据点相联系。内容的这种相互关联性是超文本背后的原理，如今几乎每个网页都使用了超文本。传统上，建立这些联系是一个手动过程，这不仅耗费大量时间，而且经常导致链接缺失和信息丢失。

考虑一下你的技术文档：你可能要花几个月的时间来制作详细的文档，但这是唯一的事实来源吗？它回答了所有可能的问题吗？在 Slack 或 GitHub 等平台上的社区讨论中已经解决的重复查询怎么办？或者在 Discourse 等论坛上展开的技术辩论怎么办？即使是一份简单的文档也会连接到许多其他数据点，从而丰富内容并提供更全面的体验。在不同的信息“孤岛”之间建立这些联系就是我们所说的上下文——这是任何 AI 原生应用程序的关键元素。

要有效地做到这一点，仅仅聚合数据是不够的；我们需要能够将主题在语义上相互连接。这就是“语义搜索”等高级功能发挥重要作用的地方。语义搜索允许更深入地理解和链接内容，使应用程序能够提供与上下文相关的响应和信息，而不仅仅是简单的关键字匹配。

1.3 用户体验模型

随着人工智能和大型语言模型的兴起，我们看到日常与技术的互动发生了根本性的转变。用户不再只是在寻求信息；他们希望立即得到答案。这种转变带来了一种新的内容创作和消费思维方式。现在，用户希望通过对话与应用和网站进行交流，而不仅仅是通过点击选项。

此外，在与软件交互时，人们越来越倾向于使用自然的人类语言。这要求我们的应用程序不仅能理解人类语言，还能用人类语言做出反应。它影响着我们设计和开发应用程序的方式——调整用户体验策略并开发更深入的语义分析能力。

为了支持这种互动方式，我们需要实现生成搜索、图像字幕、内容分类、聊天机器人和视觉搜索等功能。这些功能对于我们开发满足用户不断变化的期望的 AI 原生应用程序至关重要，可以提供无缝、直观的交互。这就是我们在 AI 驱动应用程序领域取得进步的目标。

2、这在技术上意味着什么

既然我们已经讨论了什么使应用程序成为 AI 优先，让我们来看看使这一切成为可能的技术。我们将基本技术分为三个主要领域：

数据聚合：这都是关于从不同地方获取数据并确保所有数据都能很好地同步。
数据处理：我们需要将原始数据转换为增强的 AI 就绪数据。此阶段包括各种任务，包括清理数据、分块、矢量化和一些后处理任务，例如实体识别、分类和/或摘要生成。
功能：我在这里借用了著名的 RAG 的这一划分，但在这里我们将超越这一点，因为我们不想太技术化和太具体：
数据检索：将其视为应用程序内的增强型搜索引擎，帮助您快速找到所需的内容。
数据增强：这是为了让现有数据变得更好，例如向其添加新细节或对其进行调整以帮助应用程序更好地理解不同的场景。
数据生成：借用 RAG（检索增强生成）的理念，我们不仅仅提取现有信息。我们根据用户需求即时创建新内容。我们不仅要满足用户的需求，还要满足他们接下来可能需要的内容。

3、挑战

好吧，如果你对所有这些是如何组合在一起感到好奇，那么让我们来看看如何组装一个可以处理我们讨论过的所有问题的系统。

首先，你可能需要熟悉 Python——它对于处理我们正在讨论的任务至关重要。您将组装一个包含大约十个不同组件的系统。这些组件包括文档解析器和嵌入、通过 API 部署大型语言模型，以及数据聚合、数据清理、分块和集成工具（如 Langchain）。

但挑战不止于此；这些只是与 AI 相关的元素。要构建功能齐全的真实世界应用程序和网站，您还需要更多。我们谈论的是整合内容交付网络 (CDN)、视频和音频托管等功能，甚至可能是响应式图像的图像处理。所有这些元素对于确保您的应用程序或网站在所有平台和用户环境中表现良好都至关重要。

4、我们的解决方案

在 unbody，我们已经解决了这个问题。我们尝试构建AI原生网站，并且看到了它的挑战性。

Unbody 正在开发一个AI即服务平台，该平台可自动化整个AI开发流程，使开发人员能够直接将高级人工智能功能集成到他们的应用程序中。

随着对“人工智能优先”功能的需求变得与“移动优先”一样重要，开发人员面临着巨大的挑战，因为数据分散在多个平台上，而且人工智能技术复杂，没有专业知识的人通常无法接触到这些技术。

Unbody 如何解决这些挑战：

数据集成和处理：Unbody 可自动聚合和处理来自任何来源（从 Google Drive 和 Slack 到本地文件夹）和任何格式（从 PDF 到文本文档、图像和视频）的数据。
简化的 AI 模型管理：我们的平台使开发人员能够从各种 AI 处理器和模型中进行选择，从 OpenAI 的 GPT 到 Hugging Face 上的开源选项。Unbody 无缝处理模型升级、部署和维护所涉及的所有复杂性，减轻了开发人员的负担。
交付给开发人员：通过开发人员友好的 API 或 SDK，Unbody 使将 AI 功能集成到应用程序和网站中变得像编写一行代码一样简单。这里任何上述功能都只需要一行代码。

只需连接你的数据，选择你的 AI 栈，然后只需一行代码即可开始构建。

5、示例

以下是我们使用 Unbody.io 构建的一些开源 AI 原生产品示例。希望这能给你一个更好的想法。我们始终对 AI 原生应用制作的新想法持开放态度，所以如果你有任何想法，请联系我们，让我们看看我们能如何提供帮助。

Nexlog：Nextlog 是一个基于 Unbody.io 构建的 AI 原生开源博客框架，它使阅读更具情境性和动态性。
搜索插件：此工具是改进网站和文档搜索功能的一个例子。它基于 Unbody 构建，使搜索感觉像对话一样自然，展示了我们的技术在日常任务中的实际应用。

原文链接：What the F**k is an AI-native app?

BimAnt翻译整理，转载请标明出处

AI原生应用的3个特点