HuggingFace定位研究

好吧,ML 非常庞大,这并不奇怪,提供 ML 服务的公司也吸引了同样巨大的关注和估值。至少在投资者和客户眼中,有些公司似乎有点重叠。这些值得研究的公司是 OpenAI、Hugging Face、Cohere 和 AI21 Studios。通过 Algolia,我加入了 OpenAI 的客户团队,并评估了 Hugging Face(多次)、Cohere 和 AI21。这是一个很好的机会,可以看到他们各自在进入市场时采取的不同方法。

在这篇文章中,我们将研究 Hugging Face 的产品和定位。我们将看到一家似乎仍在弄清楚自己是谁的公司,尽管它清楚地知道自己是为谁服务的。

1、Hugging Face

Hugging Face 一直备受关注,首先要归功于他们的开源 transformers 库,其次要归功于他们的业务和融资,例如他们在 2021 年 3 月筹集了 4000 万美元,而 2019 年底筹集了 1500 万美元。

Hugging Face 的上市方式是……漫无目的的。让我们看看他们的主页,看看我们能否弄清楚他们在卖什么以及他们瞄准的是谁。

Hugging Face 主页

让我们从表情符号和标题开始。这种布局非常让人联想到其他开源登录页面。将上面看到的内容与 spaCy、Next.js、React、Vue、Keras 或 Babel 的登录页面进行比较。(有趣的是,PyTorch 和 TensorFlow 的主页在风格上更加“企业化”。)它们的风格非常相似。标题说 Hugging Face 是“构建未来的 AI 社区”,菜单项让我们可以立即跳转到模型、数据集、Spaces、Docs 等。

这显然是一家面向开发人员的公司。但问题是,从信息传递的信息中根本看不出这是一家公司。如果你决定在主页上放置的内容表明你对组织的看法,那么 Hugging Face 似乎首先将自己视为数据集和模型的开源集合,使 ML 开发人员能够与其他开发人员共享。再加上 Hugging Face 最近推出的“Spaces”功能(产品?),Hugging Face 看起来首先是一个社区。

然而,这与不到一年的时间内筹集的 5500 万美元相冲突。这里一定有一些业务,我们可以看到他们如何在解决方案菜单选项下寻找资金。

这是我们再次回到那个描述符的地方:漫无目的。 Hugging Face 提供六 (6!) 种不同的产品:付费专家支持、托管推理 API、AutoNLP、Infinity、专用硬件和平台。也许在进一步研究这些产品时,我们会发现它们之间存在很大的重叠,只是针对不同的目标受众进行了重新包装。

2、付费专家支持

首先是付费支持,或“专家加速计划”。这本质上是一种咨询。这个付费支持计划的独特之处在于,Hugging Face 利用非员工作为顾问,即在机器学习方面做出重大贡献的人。有了这些顾问,公司可以解决围绕微调、延迟、投入生产、偏见和其他主题的挑战。

论点似乎是:“机器学习很难理解,我们有了解它并可以指导你完成项目的专家。” 我想知道提供付费咨询的理由有多少是来自潜在客户的反馈。我可以看到,在与这些公司的对话中,Hugging Face 听说机器学习似乎很有趣,潜在客户想探索它,但他们根本没有内部团队,现在没有理由组建团队。然而,当你阅读产品信息并注意到该计划不提供实施,而只提供指导时,这种理由就站不住脚了。这些公司仍然需要一个 ML 团队来管理实施。

此类服务的 TAM 是多少?让我们分析一下谁可能感兴趣。首先,公司需要相信 ML 是其产品的基础。他们需要已经拥有一个 ML 团队来负责实施和管理,并且相信该团队无法在没有帮助的情况下将他们的项目投入生产。或者,他们可以将其投入生产,但需要帮助进行调整或减少延迟或其他主题。这个市场一定非常小。

绝大多数公司(我们可以合理地说 99% 的公司)充其量只是对 ML 感兴趣,而那些完全投入 ML 的公司更有可能希望他们的内部团队拥有所有必要的技能,而不是去别处寻找。所以你看到的是一小部分想要实施或优化 ML 项目的公司和另一一小部分想要临时外部援助的公司。有趣的是,Algolia(我工作的地方,也是我的团队评估 Hugging Face 产品的地方)可能属于这一小撮人。但我们是独一无二的。

另一个可能的目标受众可能是拥有机器学习产品但需要专业项目帮助的开发机构。但同样,这是一个小群体。

如果我们假设有客户愿意为付费支持付费,那么 Hugging Face 就会遇到另一个问题:专业服务不是经常性收入。对于一家筹集了 Hugging Face 那样资金的科技公司来说,经常性收入是关键,否则你就得每年努力续签这些服务合同。对于 Hugging Face 提供的付费支持,这些合同是否容易续签很难说。你可以说客户通常会续签,因为机器学习进展迅速,每年都会带来新的挑战。你也可以说客户为一次性问题支付高级支持费用。很可能两者兼而有之。

专业支持服务确实有意义的一种方式是,它与提供真正经常性收入的服务紧密相关。在这里,我们看到不同 SaaS 公司的专业服务百分比存在差异。像 Appian 这样的公司可能有 50% 的收入来自服务,因为它与他们的平台紧密相关。然后,更容易改变战略,Appian 在过去几年里已经这样做了,转向更大比例的收入来自产品本身。

这种方法可以被认为是“专业服务作为客户获取成本”。对于 Hugging Face 来说,这很难做到,但并非不可能,因为他们除了付费产品外,还提供开源库。事实上,付费支持的登陆页面专门针对不使用 Hugging Face 托管推理 API 或容器化产品(我将在下文详细介绍)的公司。如果 Hugging Face 可以使用付费支持将客户转移到这些其他产品之一,那么它看起来就更具战略性。

3、托管推理 API

客户可以迁移到的其中一个产品是托管推理 API,这是由 Hugging Face 托管的 API,客户可以在其中托管模型并在推理时调用。Hugging Face 声称有超过 25,000 个模型可用,并对延迟、可扩展性和 SLA 进行了优化。价值主张是:不用担心基础设施,我们会处理好。

我认为这是 Hugging Face 最有前途的产品,也应该是他们的核心重点。

API 的营销文案很好地体现了价值主张。第一个子标题是“即插即用机器学习”,在页面下方是“让我们进行机器学习”。我有一个批评意见,那就是这甚至不在页面上更靠前的位置。“通过简单的 API 调用使用 25k+ 模型”的主要标题没有表达足够强烈的观点。

Hugging Face 推理 API 登陆页面

就像我们对高级支持产品所做的那样,让我们​​研究一下市场,看看为什么 API 是他们最有前途的产品,也是他们最不重视的产品。

托管的、ML 驱动的 API 市场非常庞大。不久前,我与一位前同事进行了交谈,他具体询问了 Hugging Face。我不记得他到底需要做什么——一些 NLP 任务——但重要的是,他不在一家科技公司工作,而是在一家技术支持的公司工作。也就是说,他的公司不销售技术,也不做研发。他们的开发团队可能有十几个人,甚至不会聘请 ML 团队。

Hugging Face API 可以为像我前同事这样的公司提供任务支持。这些公司将需要某些 ML 任务,并正在寻找轻松运行它们的方法。这个市场的规模几乎相当于所有拥有开发团队的公司,减去那些规模足够大或技术足够先进,能够拥有能够在内部训练、托管和管理模型的团队的公司。与专业服务产品不同,托管推理 API 的 TAM 一开始就非常庞大。

Hugging Face 可以通过大量依赖“让我们做机器学习”消息来吸引这些公司,并为只想完成任务的开发人员和产品经理构建产品。这里的任务是产品和产品营销。

在产品方面,API 需要对开发人员和 PM 友好。开发人员已经得到了很好的服务——API 易于使用和集成。开发人员体验可能会有一些改进(例如客户端库),但他们已经有了一个不错的开端。 PM 角色可以通过更好的报告和见解得到更好的服务。目前这些功能还很基本,主要侧重于成本管理。更好的趋势报告、详细使用情况和更详细的统计数据将对 PM 和开发人员都有帮助。

4、产品营销和定位

产品营销和定位方面是 Hugging Face 真正不足的地方。

首先我必须指出,他们在向开发人员传达价值主张方面做得很好。Hugging Face 在很多方面都在与 Hugging Face 本身竞争。托管推理 API 正在与 Hugging Face 开源库竞争。通过大量传达让其他人拥有基础设施以及改进的延迟和吞吐量的价值,Hugging Face API 为使用 Hugging Face 库提供了强有力的反驳。

当然,我这么说有点虚伪。我们在 Algolia 构建一个我们称之为语义突出显示的功能时探索了推理 API。最后,我们决定不采用推理 API,尽管它的优势很有吸引力。我们决定使用库并自己托管它,因为它运行良好,而且我们不必经过法律和安全审查流程来引入新的数据处理器。因此,在这种情况下,我们看到了“立即实施和迭代”的潜台词,即“没有时间……除非你必须经历漫长的审核过程。”

消息传递对开发人员如此有效,问题在于 Hugging Face 在开发人员中的知名度已经很高,而需要的是让产品制造商认为“我们可以为此使用 ML”。最需要被说服的人不是开发人员,而是非技术人员。Hugging Face 应该大力推广这一点。他们在 API 的登录页面上进行了一些尝试,但他们只做了一半。

需要完全替换此部分。这些都是开发人员术语。公司的非技术成员需要确切地知道 Hugging Face 托管推理 API 可以做什么来实现他们的目标。不要谈论标记分类,而要谈论在文本中识别位置。不要谈论表格问答,而要谈论在财务报告中寻找见解。

现在看看 Hugging Face 博客或时事通讯,你会发现内容几乎完全是针对开发人员的。Hugging Face 需要以某种方式为 PM、营销经理和其他不仅对购买决策有巨大影响,而且对寻找购买技术的决策也有巨大影响的人引入更多内容。Hugging Face 需要努力推动他们的技术能够实现什么。

通过整合面向用例的内容,Hugging Face 获得了多重好处。第一个好处是扩大市场。在 ML 工具方面,Hugging Face 是开发人员的领导者之一,在谈论 ML 可以为企业做的一切方面成为领导者并不难。如果我们想想 OpenAI 已经成功做到了什么,差异就很明显了。OpenAI 的技术水平不亚于 Hugging Face,但仅凭一个模型产品,他们就能够让非技术人员谈论它并想象新的用例。我听到很多非技术人员谈论 GPT-3,却很少有人谈论 Hugging Face。OpenAI 让人们思考机器学习在未来五年能做什么,因此它已成为“强大的机器学习产品”的代名词。

认真考虑用例信息传递的另一个好处是,可以更轻松地扩展现有合同。在说明对象检测可以为企业的底线做些什么时,到目前为止一直使用 Hugging Face 进行翻译的客户现在可以看到将现有提供商用于其业务更多部分的机会。Hugging Face 可以为公司提供多种构建模块,供其在构建产品时使用。随着可组合商务一词的兴起,您会在电子商务中经常看到这种情况。

这里的挑战是 Hugging Face 会在一定程度上扩大竞争对手的数量,而且它无法与任何一个竞争对手很好地抗衡。它将在图像识别、NLP 和文本摘要等领域与亚马逊、谷歌、微软和 IBM 竞争。这些平台很可能已经存在于公司的堆栈中,并为非开发人员提供更好的工具来微调服务。相反,还有更多的参与者专注于一种用例,例如语音识别。

Hugging Face 可以通过专注于这些价值主张来对抗这些竞争对手:目标模型、速度/延迟和实施速度。此外,Hugging Face 的竞争对手规模庞大,行动缓慢。在机器学习中,这是一个负面因素,因为模型有时会在一年内被超越。Hugging Face 不断添加新模型,因此可以为客户提供继续使用性能最佳的模型的能力。

最后,这种用例扩展不应仅限于登录页面上的消息传递。 Hugging Face 有机会利用教育吸引新买家。顺便说一句,Hugging Face 正在扩大其教育范围,但重点还是放在开发人员身上。他们有机会向非开发人员介绍 ML 可以做什么,投资围绕该主题的内容可能会奏效。“ML 可以为法律团队做什么”、“电子商务的自然语言处理”等文章在开发人员听来很俗气,但它们确实有效。

这里有一个工作基础。Hugging Face 有一个任务部分,其中介绍了不同模型可以做什么,但目标仍然是开发人员为主。这对于开源库来说很棒,但对于 SaaS 产品来说就没那么好了。

企业使用文本分类来做什么?业务成果是什么?如果有数据,可以加分,但现在甚至不需要。他们应该淡化“蕴涵”或“多类型自然语言推理模型”等术语。将其保存到开发人员文档中,并使用此部分来说明交钱的商业案例。>

接下来的这三项产品非常“你显然需要它,或者你显然不需要它”。AutoNLP(后来更名为 AutoTrain)自动训练和托管 ML 模型。Infinity 是一种优化的容器产品。硬件就是它的名字。

5、AutoTrain

AutoTrain 是三者中最有趣的。与我交谈过的大多数 ML 工程师都认为这项服务没有太大好处,但我认为它还是有好处的,即使目标市场仍然很小。

限制 AutoTrain 市场发展的原因是,机器学习的许多难题仍然存在,因此受众通常都是技术娴熟的工程师。

收集数据是机器学习最困难的部分之一。也许不是技术上最困难的,但在实践上却很困难。在创建新模型时,几乎总是存在“冷启动问题”。另一个与数据相关的困难是选择特征。AutoTrain 似乎没有解决这两个问题。

AutoTrain 的一个主要优点是它“会自动为数据找到最佳模型”。这显然是一个非常好的好处。Hugging Face 的模型中心有近 40,000 个模型。即使缩小到英语问答,也会返回 132 个结果。英语文本分类有 453 个。拥有一个可以选择其中哪个模型在任务上表现最佳的服务是很好的。不过,大多数人只会选择一次模型,因此这不是一个持续的好处。

同样,我想知道 AutoTrain 能让我做什么,而我在其他地方做不到。如果我们将 AutoTrain 与竞争对手 Google 的 AutoML 进行比较,定位上的差异是显而易见的。AutoML 谈到我如何“通过机器学习揭示文本的结构和含义”或“从对象检测和图像分类中获得见解”。也比较一下客户故事。Google 向我们展示了 California Design Gen 能够更好地了解单个产品的表现,从而“库存结转减少 50%”(用例和好处)。我不知道库存结转是什么,但我知道减少 50% 意味着什么,我喜欢它。与此同时,Hugging Face 告诉我,AutoTrain 可以为“非研究人员”“[民主化] NLP”。最后一部分很好,但如果我还不了解的话,我仍然无法更进一步地理解它如何融入我的业务。

我还可能想知道,如果我是潜在的 Hugging Face 客户,AutoTrain 和付费专家支持如何共存。回想一下:付费专家支持的价值主张是机器学习很难,你需要雇人来帮忙。AutoTrain 的价值主张是机器学习不再困难。我是否只在数据收集和特征选择方面遇到挑战时才求助于付费专家支持?或者付费专家支持的持续存在是否表明 AutoTrain 并没有真正为非机器学习工程师“解决”机器学习问题?

6、Infinity 和硬件

我不会花太多时间在这两个方面,因为它们同样是你要么明显需要要么明显不需要的东西。它们不会扩大 ML 的市场,这没关系。我在这里要说的一件事是,我有点惊讶 Infinity 在 Hugging Face 的消息中并不更流行。Infinity 是容器化的 ML,声称延迟为 1ms。这令人印象深刻!

如果我不得不猜测为什么 Infinity 不那么流行,那是因为该产品的市场相当小。很少有公司真正需要实时推理,而那些确实需要它的公司也需要高吞吐量。你没有在页面上看到它,但我们在与 Hugging Face 的对话中了解到(你也可以在 Infinity 页面上的 Otto 客户视频中看到),但 Infinity 不支持批量请求或多 GPU。对于没有这种吞吐量的客户,大多数客户可能会接受更长的推理时间。我认为,如果 Hugging Face 能够提高吞吐量,那么这将会是一款更有趣的产品。

7、Hugging Face 的 ICP 是谁?

在查看了 Hugging Face 的产品、定位和上市策略后,他们显然将产品定位为 ML 开发人员。这显然是有效的——Hugging Face 在那群人中拥有惊人的知名度。然而,他们对自身和付费产品的定位也有点漫无目的。Hugging Face 是一个社区、托管解决方案还是基础设施?目前,它们都是上述两者。

此外,对于六种付费产品,我们没有重新包装相同的产品,而是不同的产品,这意味着不同的销售动作、不同的营销工作、不同的买家等。从长远来看,这可能非常有效,但至少需要有一个更好的故事,说明人们何时应该成为 Hugging Face 的客户,以及他们如何从小客户成长为目前尚未出现的大客户。

Hugging Face 目前最有前途的产品是 Hosted Inference API。然而,为了覆盖尽可能广泛的市场,Hugging Face 需要将范围从 ML 工程师扩展到技术组织中的其他人。如果 Hugging Face 可以向产品经理或 CMO 展示他们可以用 Hugging Face 的技术做什么,以及它如何帮助他们的业务,那么 Hugging Face 就有机会通过在组织内慢慢添加用例并随着时间的推移增加他们的参与度来落地和扩展。

我真的很想知道未来几年会如何发展。投资者显然对 Hugging Face 团队有信心,但我们以前也看到过开源驱动的企业步履蹒跚。Hugging Face 会这样做吗?🤷‍♂️


原文链接:Looking at Hugging Face's Go-to-Market and Product Positioning

BimAnt翻译整理,转载请标明出处