Gen-AI产品的护城河
人工智能在 2022 年取得了如此显着的进步,以至于全世界终于接受了这项技术现在可供普通人日常使用。
GPT3 和 Stable Diffusion 等生成式 AI 模型将使我们能够以以前无法想象的规模和速度进行创作。 这将从根本上改变人类创造价值的方式。 我们用于创作的每一个数字工具—从编码环境到视频编辑器再到 3D 建模软件—都将发生根本性的变化。
虽然展示 AI 生成艺术的演示令人印象深刻,但演示并未考虑实际的专业工作流程和行业要求。 通过通用界面访问这些模型非常适合进行实验和创建社交媒体帖子,但这还不足以让不同领域的专业人士有效地完成工作。 为此,我们需要将这些模型融入产品中,以便它们在专业工作流程中提供真正的实用性。
当我作为一个对时装业知之甚少的人尝试将 Stable Diffusion 用于时装设计时,我突然意识到了这一点。 对我来说,为时装设计师设计一款无限创意的生成式 AI 产品似乎是一个显而易见的想法。 出于热情,我使用 Stable Diffusion 生成了这张裙子图像,并与我的时装设计师朋友分享。
“你能用这个想法设计一件这样的新衣服吗?”,我问。 她的回答是令人失望的“不”。 除了或许用在情绪板上作为灵感,这张图片对她来说毫无用处。
因此,对于 Stable Diffusion 的所有生成能力,其当前格式的输出对时装设计师来说并不是很有用。 为了让人工智能真正交付价值,我们需要考虑如何以实际方式使用它的输出。 这可能涉及预处理模型的输入、后处理输出或将它们与人工生成的内容相结合。 关键是利用人工智能的独特能力,专注于为用户解决现实世界中的具体问题。 让我们探索如何让这个看似神奇的新技术为我的时装设计师朋友所用。
1、AI产品战略框架
对于从事 AI 产品的创始人和产品负责人,我推荐两种广泛的方法—纵向和横向。 垂直方法涉及为特定行业或利基市场的创意过程构建人工智能辅助软件产品。 一些例子是时装印刷设计和家具设计。 这些利基市场中的每一个都有我们必须牢记的不同要求和工作流程。
横向方法涵盖旨在实现跨行业所需功能的产品,例如平面设计、广告设计或法律合同起草。 从汽车到食品,各行各业都需要广告创意。 在这里,产品不需要特定行业的工具。 最重要的是一个很棒的用户界面,它允许用户在更短的时间内完成图形设计工作,而且质量比以前更高。
2、垂直AI产品
在为特定行业构建 AI 驱动的产品以及部署最先进的 AI 模型时,构建其特定工作流程所需的工具至关重要。 以下是为时尚行业生成织物印花设计的 AI 产品需要涵盖的内容:
- 用户必须能够为生成式 AI 扩散模型提供情绪板图像以及文本提示作为输入。 情绪板和提示文本通常是通过对当前高销售趋势的数据分析得出的。
- AI 模型必须为打印生成无缝纹理。 无缝纹理是可以放置在自身旁边的图像—上方、下方或并排—而不会在图像副本之间创建明显的接缝、连接或边界。 这是我通过调整稳定扩散代码生成的无缝纹理示例。 该图像由四个并排放置的生成图像组成。
- 创造力是一个迭代的过程。 设计人员应该能够通过手动编辑或通过在后续 AI 生成中引入特定修改来迭代地修改每个 AI 生成的输出。
- 需要具有不同角色的用户进行多级批准。 设计主管可能需要签署最终设计。
最终输出需要放大到足够高的分辨率。 - 最后,输出必须转换为可以发送到织物打印机的矢量文件格式。
面向时装设计师的产品需要围绕生成式 AI 模型的输出构建的行业特定工具。
考虑另一个 AI 协助室内设计的例子,它生成有关如何以特定风格改造房间的图像。 以下是一篇文章的节选,其中专业室内设计师分享了有关使用 AI 室内设计工具的反馈。
当我们要求它创建一个“波西米亚风格”的客厅时,Horace 指出该算法选择了一个与她为想要相同外观的客户使用的类似调色板。 “我可以将其用作为情绪板开发图像的工具,”她补充道。 “参考资料都中肯了。”
“桌子旁边有一个奇怪的自助餐,出于某种原因还有两张咖啡桌,看起来不太实用,”中世纪客厅的贺拉斯说。 “看起来不错,但你不能把它呈现给客户,就像,嘿,这是你的房间!”
Interior AI 的空间规划技能有时会让人不满意——而且它的浴室并不总是包括马桶。
该工具经常会给出一个房间的基本近似值,但会改变比例、去掉一扇窗户或将天花板降低几英尺。
从设计师的审查中可以明显看出,室内设计产品的 AI 模型需要在某些限制条件下运行,这些限制条件是无法修改的。 他们的评论可以用一句话概括——
依靠大量的 2D 灵感图像来形成对设计的理解,它完美地把握了风格,但对功能的把握却比较松散。
请注意时装设计师的问题和约束与室内设计师的完全不同。 但是,共同点是需要更好的特定于其行业的功能,而不是只关注样式。
对于像 Stable Diffusion 这样的 AI 模型,在与行业相关的数据集上微调模型至关重要。 对于时尚印花设计,设计师可能希望根据特定风格、调色板或心情生成图案。 使用一些示例微调生成模型将有助于生成更相关的设计。 即使对于其他深度学习模型,例如那些用于对象识别和分割的模型,也可能需要微调,其中所讨论的对象不存在于开箱即用的预训练模型的训练数据中。 最终我希望模型微调工具将集成到每个产品中。 可能有一家大型公司等待建立,提供模型微调作为 API 服务。
3、垂直人工智能产品的护城河
产品或公司不能依赖 AI 模型作为唯一的竞争优势。 人工智能研究论文及其实施代码通常是公开的。 OpenAI 发布了用于文本到图像生成的 Dall-E 和 Dall-E 2 模型,并且在开源 Stable Diffusion 模型发布后不久。 人工智能吸引了一些世界上最优秀的人才,这个行业正在迅速发展。 它保证有人最终会发布一个比你当前实施的模型更好的新模型。
为特定行业开发 AI 产品的一个巨大优势是更容易创建可防御的商业护城河。 为该行业构建的工具为客户带来的便利也使他们不太可能仅仅因为发布了新模型而离开。 这为将 AI 模型输出改进为最先进的基准测试赢得了业务时间。
4、横向AI产品
当涉及跨行业的图像编辑或图形设计等领域的产品时,基于人工智能的新产品面临着老牌巨头的艰苦战斗。 这是因为像 Photoshop 和其他产品这样的产品正在迅速引入由 AI 提供支持的功能。 依赖 Photoshop 广泛的图像编辑工具的专业人士更愿意使用 Photoshop 中的 AI 功能,而不是切换到其他产品。 由于现有巨头分布广泛,许多构建横向 AI 产品的初创公司可能会短命。 如果人工智能模型被集成到人们已经大量使用并付费的工具中,他们就没有动力转向另一个工具。 拥有 2000 万用户的笔记应用程序 Notion 最近推出了一款 AI 写作助手。 由于 Notion 现有的庞大用户群和网络效应,新的人工智能文字处理器可能难以与之竞争。
任何新的横向 AI 产品的机会在于为不擅长该领域的用户提供优质、廉价和快速的输出。 一个流行的笑话是,与设计师合作时,你只能得到三分之二。
要想成功,任何新的横向设计 AI 产品都必须向非设计师用户提供这三者。 不用说,该产品应该易于使用。 除非是,否则用户不太可能快速获得高质量的输出。 换句话说,机会在于降低进入创意领域的门槛,该领域以前由熟练的专业人士主导。
Canva 是一家已经证明这一点的公司的一个很好的例子。 Canva 使会计人员能够制作出色的活动海报。 他们证明,设计师经常成为瓶颈的大部分设计不需要 Photoshop 的高级工具。 Canva 通过使用模板和库存内容构建一个简单的产品,让他们能够快速、廉价地创建好的内容,从而找到了非设计师的利基市场。 AI 感觉就像是 Canva 的时刻,但它适用于每个创意领域,而且规模要大得多。 GPT3 和 Stable Diffusion 等生成式 AI 模型尤其相关,因为非设计师用户不必从零开始。 取而代之的是,仅通过文本提示,他们就获得了一个远远领先于他们本来可以创造的起点。
经过大量实验后,用户界面可能会发生一些根本性的变化。 对于如此多的主题,ChatGPT 的对话界面在返回准确答案方面比谷歌搜索要快得多。 会话界面看起来对各种应用程序都非常有前途。 你对设计师“颜色需要更蓝”的渴望终于得到满足。
对于生成模型,艺术风格预设、预微调模型以及即时微调功能可以让用户更好地控制输出。
5、横向 AI 产品的护城河
部署在高质量和大型数据集上训练的性能最佳的模型对于水平 AI 产品可能非常有益。 由于这些产品需要为各行各业的用户服务,投资人工智能研发以保持最先进的模型性能可能是一条强大的护城河。 然而,由于竞争激烈的格局和流入 AI 的资金量,它并不是唯一的护城河。 可以通过用户体验、产品定位、分销、社区、网络效应、团队的执行力和用户反馈的快速迭代来建立额外的护城河。
RunwayML 是一个人工智能驱动的视频创作者和编辑者,在这方面做得很好。 RunwayML 正在降低内容创建的门槛,其功能从擦除和替换对象到视频中的自动运动跟踪。 他们对 Stable Diffusion 开发的贡献意味着他们正在投资推动最先进人工智能的发展。 通过结合使用这些方法,RunwayML 已经获得了大量客户,并正在围绕他们的业务建立长期的护城河。
Canva 的成功在很大程度上可以归因于其定位为非设计师工具的护城河。 该客户群与熟练设计师使用的 Adobe Photoshop 和 Illustrator 的目标受众不重叠。 深刻理解和接受他们的定位帮助 Canva 引入了设计师在培训中学习但普通用户不知道的东西的功能,例如调色板生成器和字体建议。
建立一个繁荣的社区是建立护城河的一种很好但被低估的方式。 积极参与和发展社区可以提供深刻的产品反馈。 这在使用适合非专家的新用户界面构建功能时特别有用。 通过社区参与的快速反馈循环可实现快速的产品迭代。
6、生成式AI产品的经济影响
用于内容推荐、图像重新照明、光学字符识别和语音转文本等应用的 AI 工具已经存在了几年,并且已经成为我们每天使用的产品的一部分。 积极协助我们从图形到代码的一切创作过程的 AI 产品浪潮才刚刚开始。 每个人都挂在嘴边但似乎没有人有明确答案的问题是这将如何影响人类的工作? 这是一个非常困难的问题,没有唯一的答案。 但是我敢肯定,答案并不在于人工智能完全取代人类与人类思维不可替代这两个极端。 在我看来,一个经得起时间考验的结论性答案是不可能的。 微妙的答案将位于中间的某个地方,根据技术随着时间的推移不断在这些极地端点之间移动。
一段时间以来,数字艺术家一直在 Photoshop 中使用 AI 支持的功能来完成智能背景移除和内容感知填充等任务。 它只是在引擎盖下,并没有公开宣传为 AI。 如今,生成式 AI 扩散模型能够从创作过程的第一步开始做出贡献(让我们将第一步视为决定为什么要创作和创作什么)。 虽然 AI 早期只贡献了一小部分创意输出,但随着时间的推移,它的贡献会越来越大。 我看到这些新的创作工具带来了两个明显的后果:
- 他们将大大降低许多领域的进入门槛,从而导致创作者数量激增
- 它们将使创作者能够在给定时间内产生更大的输出量
第一个后果将意味着更多的人类就业、经济活动和货币增长。 突然之间,好莱坞的工具就在每个人的口袋里。 第二个后果意味着更少的人可以完成许多人的工作,导致雇主解雇大量人员。 这会导致灾难性的大规模失业吗? 还是这些人也会成为独立的创作者? 这些事情是出了名的难以预测。 每个人都认为人工智能会消除重复的体力劳动。 有创造力的人很安全。 没有人认为人工智能会编写代码或创造艺术。
世界将分为使用 AI 的人和不使用 AI 的人。
构建这些产品的人将获得丰厚的回报。 我们正处于一个可能被人们记住的人类历史上最具决定性的时期的风口浪尖。
原文链接:Generative AI Product Strategy: How to Build Next-Generation AI Products
bBimAnt翻译整理,转载请标明出处