HuggingFace的崛起
从外部来看,社区可以通过他们共同的集体行为来识别,无论是俚语、服装还是普遍价值观。
你还如何解释下面的服装? 为了增加真实感,想象一个蓝色徽章和头部向下倾斜,拼命避免目光接触。 只要闭上眼睛,想象一下他们在咖啡馆里用贴有公司贴纸的银色 MacBook 进行业余项目编码。 现在是周末,谁能处理好知道某个地方存在着更成功的人。
对于自称有个人思想的人来说,我们确实看起来都一样。
1、追寻意义
尽管我们在现实世界中分享的一切,我们的差异在我们的网络角色中转移得更多。 过去的超级英雄已经死了,我们不需要一个披着斗篷的十字军来保护我们免受暴政的侵害,我们需要一个风险投资家的真人角色扮演市长来帮助我们更好地管理城市的衰败。 危险在于我们的过程而不是我们的敌人,我们渴望波动,在古人的智慧中寻求庇护。 拯救我们的不是超人,而是林迪曼。
那么给出什么呢? 为什么很多聪明人既富有又疏远? 这也许是历史上第一次,书呆子的薪水如此之高,但似乎缺少了一些东西。 也许搬到半个世界的一居室公寓里并不值得。 他们的安全网与什么有关系? 做白日梦或忙碌并不像为社区做出贡献那样令人满意。
那么,当相同的项目变得比我们的规模更大时,为什么会感到不安呢?嫉妒是否背叛了我们的真实意图? 我们为什么要使用软件工具?
2、作为实现的开发工具
人们使用软件不仅是因为它解决了业务问题,还因为它解决了核心情感需求:
流行的开发工具不仅仅是解决问题。 他们解决核心情感需求:
HuggingFace 让你感觉自己很聪明
Unity 让你再次感觉像个孩子
Github 让你感觉被关注
Fastai 让你有归属感
VSCode 让你感觉自己像个修补匠
—— Mark Saroufim, @marksaroufim
解决技术问题意味着你的用户将用金钱来换取该问题的解决方案。
解决情感问题意味着你的用户成为社区成员,他们将贡献代码、想法、博客文章、视频和一大堆外部因素,这些因素会引起人们的关注,以确保你的成功。
不久的将来成功的开发工具都将是社区。
有多少企业可以声称可以帮助你解决心理和自我实现的需求? 其市值是国家、宗教和娱乐业历史价值的总和。
然而,未能满足这些情感需求使得大多数机器学习初创公司很难取得广泛的成功。
3、AI的商业模式
我们能用AI来告诉我们要投资哪些项目吗?
AI不会帮助你实现产品市场契合(PMF),但一旦实现PMF,它将帮助你将业务扩展到前所未有的高度。
机器学习初创公司的商业模式传统上分为 5 个阵营之一,我按照提高盈利能力进行了分类:
Service:服务
- 内容:按推理向用户收费
- 优点:清晰的商业模式
- 缺点:网络蒸馏使得护城河变得不可能。 离被破坏只差一篇研究论文。
- 示例:Clarif.ai
Consultancy:咨询
- 内容:帮助没有 ML 专业知识的企业使用 ML
- 优点:许多容易实现的目标,但具有很大的上升空间
- 缺点:只有当机器学习仍然困难时才可持续。 (不会)。 绝大多数机器学习初创公司都是咨询公司。
- 示例:大多数 ML 初创公司
- 例外:如果你是 Geoff Hinton 级别的人,创办一家有限责任公司可以让你被收购,而不是像我们其他平民一样被雇用
Media:媒体
- 内容:发表很酷的论文并获得大量关注
- 优点:你可以做任何你想做的事情并雇用最好的人
- 缺点:只有当你已经非常富有和成功时才有可能
- 示例:Open AI
- 注意:Open AI是最难估值的,因为通用人工智能的可能性很小,但回报是无限的。 因此,如果他们成功,他们将加入爱因斯坦和牛顿等伟人的行列,如果他们失败,他们将成为庞氏骗局。
Platform:平台
- 内容:人们在你的平台上构建自己的服务
- 优点:价值是建立在其之上的一切的百分比。 这很好。
- 缺点:难以构建
- 示例:Weights and Biases
Community:社区
- 内容:平台+强大的群体认同
- 优点:有平台、媒体和宗教的好处
- 缺点:非常难以构建
- 示例:Huggingface
如果你认为自己正在构建一个平台,但实际上是在构建媒体业务,那么了解自己所处的领域对于成功至关重要,你将与最好的媒体企业竞争,而不仅仅是你的竞争对手。
如果你的受众主要是传统金融机构,那么开放性和古怪性就是不利因素。
传统的企业销售会要求你构建一些有用的东西,然后尝试将其出售给较大的云公司之一,该公司的 ML 建模管道现在往往如下所示:
这些大公司不需要你的服务、媒体、咨询服务或平台,因为他们有足够的内部版本。 对于机器学习初创公司来说,企业销售的整个前提似乎有一个重大弱点。
唯一让大型机器学习公司陷入困境的是大型社区,他们最终出于生存的需要而不得不支持这些社区。
拥抱、扩展、消灭是对抗强大社区的唯一可能的生存策略,但它总是冒着无法保证致命一击的风险。
4、梅特卡夫定律
梅特卡夫定律是在社交网络盈利之前对其进行评估的好方法。 社区的价值随着用户数量的平方而增加。 但是,由制造商组成的社区而不仅仅是消费者,可以进一步提高该指数。
我之前曾将 Open AI 称为一家媒体公司,但这是一个被广泛误解的观点。 我应该说的是,学术界属于媒体行业,其贡献正在争夺所有研究人员有限的注意力, Open AI恰好是这方面最好的。
媒体是新的营销和招聘策略,但如果没有平台或社区作为支撑,它的潜在能量就无法转化为更多的东西。
5、反身性
你如何看待像 🤗 这样可爱的表情符号,它是历史上最大的公司之一发布的现有项目的分支。
这篇文章提到:
“我认为,如今机器学习面临的一大挑战是,大部分权力都集中在几个大组织手中,”他说。 “我们一直有来自大型科技公司和其他公司的收购兴趣,但我们相信拥有独立公司是件好事——这就是我们正在努力做的事情。”
HuggingFace 是真人角色扮演吗?
是的! 对于任何在线第一社区来说,这都是一个特别有效的策略。 反身性意味着如果有足够多的人相信某件事,那么它就更有可能成为现实。
2021年,反身性已成为媒体上反复出现的流行主题。 只要购买特斯拉和比特币就意味着你的表现优于大多数对冲基金。 自反性是如此强大,以至于像 WallStreetBets 这样的团体可以通过💎🙌进行协调,以发起一场反对现有金融体系的全球和平革命。
“如果有足够多的人相信某件事,那么它就会成为现实”,最终以“🦍在一起坚强”进入主流词典
如果 HuggingFace 相信自己将成为未来的机器学习公司,无论真实与否,世界都会变得更加有趣。 他们越相信,像我这样的人就越有可能相信,写关于他们的文章,反馈循环就会继续。
我们所有人都渴望好故事。
6、FOMO保险
HuggingFace 将自己定位为机器学习的 npm,但他们实际上在销售什么? 这不是请求,因为他们不是云提供商,这不是算法,因为他们已经将它们全部开源。
HuggingFace 出售 FOMO 保险
FOMO 是一个真正困扰你的情感问题,它迫使你下注,而不是遭受无休止的分析瘫痪,而这些下注需要很长时间、教育和勇气才能看透。 HuggingFace 拥抱你并告诉你一切都会好起来的。
如果我是 HuggingFace,我会如何营销 HuggingFace:“不用担心你需要了解或支持哪种 Transformer 架构的具体细节,我们将为你实现所有这些,并让你知道哪一个是最好的。
有一天,你会找到合适的数据集并开始建立你的初创公司或获得晋升,我们可以向你保证,我们将为你提供的数据集加载器将是 👨🍳 😘
没有缺点、无限的优点是一个令人信服的价值主张。 特别是如果 Transformer 是通用计算引擎的话,虽然对此说法尚无定论。
但即使没有定论,反身性仍然可以证明 Transformer 实际上是解决大多数问题的最佳架构。 硬件将为他们进行超级优化并报告他们的公共基准,编译器编写者将展示他们的各种 IR、融合、降低技巧,以使其成为运行 Transformer 的最佳人选。 现在,即使从长远来看其他一些随机技术实际上会更好,也需要付出很大的努力才能了解自己脱离这个局部最优值。
7、精益创业 Redux
精益创业方法论认为,建立一家成功公司的最佳方法是弄清楚用户想要什么或需要什么,并为他们建立它。 但对于开发工具来说,我们人为地将用户在个人层面的需求与他们在专业层面的需求分开。
Tensorflow 于 2016 年发布,得到了历史上最大的公司之一的支持,在 Github 上拥有约 155K 星。 HuggingFace 是一个由几位研究人员发起的项目,拥有 44,800 颗星。
Github stars是衡量任何开发工具产品市场契合度的最佳指标
产品市场契合度并不能保证你会取代科技巨头,但缺乏市场契合度则保证你不会取代科技巨头。 如果你不能说服任何人免费使用你的产品,你怎么能说服他们付钱给你呢?
另一个例子:Julia 编程语言能够快速运行程序,因为它有两个核心特性:多重调度和 Julia 社区。
多重分派,因为它可以帮助你编写运行速度快的通用代码,并且可以帮助社区,因为如果你在任何地方公开宣布 Julia 运行缓慢,你将得到 Julia 社区成员通过重写整个代码库来纠正你的错误。
8、历史小说
历史是从最好的讲故事者的角度讲述的。
在比较企业时,您如何评价社区? 无穷? 零? 介于两者之间的东西吗?
如果评估企业价值的模型未能捕捉到拥有 Github 明星或 Twitter 粉丝形式的受众的重要性,那么,与其在回到扶手椅之前大喊泡沫,不如承认我们现有的解释和故事已经失败了。 为 HuggingFace 的兴起提供充分的解释。
一些关于 1600 年代郁金香的杜撰故事持续了大约 6 个月,使我们无法意识到范式转变何时正在发生。
HuggingFace 的护城河是社区而不是源代码。
9、开源宗教
宗教可以说是解决情感问题的最佳结构。 最好的开源与宗教有许多相似之处。
- 创立时刻:第一次提交
- 经文:Git 历史
- 牧师:PR合并
- 培训中的牧师:PR提交
- 关注者:用户、博主、记忆者
未来的每家公司都将成为一个社交网络,但通过聚焦受众,他们可以创建一个更加紧密的群体身份。
10、修补
举个例子,如果我真的想看到石榴糖浆可口可乐上市,我需要赢得一些可口可乐比赛,可能会有大量的参赛者,可口可乐高管之间的幕后会议,一长串复杂的命令需要 并在整个供应链中进行协调。 无论我多么努力,我最多只能是可口可乐消费者,而不是社区成员。
也许Marx的异化理论很明智,该理论认为,脱离了思考和参与产品设计的权利的工人总是会感到异化(Alienation)。 OSS 社区通过使一切都可反思、可重新混合和可改进来解决这个问题。
下次当你拖延回答项目中的 Github Issue 或 Pull Request 时,请考虑另一端的真人希望引起你的注意,并因为没有得到你的关注而感到沮丧或不安全。 如果有更多的时间和关注,你可以将这个人变成维护者。 我们都需要得到我们敬佩的人的拍拍,所以帮助第一次维护者确定他们的贡献范围,不要挑剔,让他们感到受到重视和赞赏,即使贡献很简单。
11、薛定谔的基准
如果你发布暗示数据库速度缓慢的基准测试,数据库公司或硬件供应商将直接起诉你。
- 开源公司:开放Github Issue提升产品性能
- 闭源公司:起诉诉说产品性能缓慢的人
闭源基准测试可以快也可以慢,具体取决于运行它们的人。
开源产品通过不断的用户反馈得到强化。
12、招聘人员的困境
- 我们只雇用最好的
- 最好的都有优惠
- 😢
我从招聘经理那里听到的第一个抱怨是他们找不到好的候选人。 我的热门观点是,这是一个自我强加的问题,之所以会失败,是因为我们狭隘地关注优秀的含义,即:在更有声望的竞争对手工作。
具有强大社区的开源产品意味着你可以聘请最优秀的人才,而无需向他们支付高价,并且你将免费获得源源不断的贡献和错误修复。
社区是招聘人员的黑客,聘请最优秀的贡献者作为软件工程师,聘请最好的作家作为营销人员,聘请问题终结者作为产品经理。 他们是隐藏在众目睽睽之下的 100 倍员工,给他们湾区的工资,并告诉他们可以远程工作,你就会拥有一名优秀且忠诚的员工。
这一策略极大地降低了公司的招聘风险,同时也为候选人提供了良好的对冲,以防 HuggingFace 没有为他们提供职位。 如果你告诉全世界,他们获得 6 位数的 ML 工作的可靠方法是为 HuggingFace 做出贡献,那么很多人都会为 HuggingFace 做出贡献,其中一小部分人可能非常优秀。 HuggingFace 生态系统和技能对其他科技公司来说变得更有价值。
13、一切都很棒!
那么为什么所有机器学习初创公司都发布教程和博客文章呢? 这不是因为他们愿意,而是因为他们必须这样做。 他们也试图通过 LARP 的方式进入社区,但缺乏联系。 他们是你父母的奇怪朋友,当你礼貌地点点头并希望你在其他地方时,他们会给你关于生活的真正建议。
“内容营销”在很大程度上太安全了,它是一种加工过的香草冰淇淋口味,意味着尽可能少的人不喜欢,但几乎没有人喜欢。 你很棒,你的竞争对手很棒,一切都很棒!
你不能通过在产品之上附加“内容策略”来建立社区。 HuggingFace 与用户进行私下、频繁、公开的互动。 你支持项目和创始人,不需要薪水或股权。
一个社区只有在接受不受欢迎的情况下才能建立强大的群体认同。 这是游戏开发者非常了解的事情。 社区需要有能力说我不喜欢 X 产品或 Y 公司。
例如,DOTA 2 中最令人讨厌的角色永远不会从游戏中删除。 技术人员是一个在地图上到处放置炸弹的角色,并且可以触发他们杀死游戏中几乎所有英雄,而在地图的另一边。 技术人员可以将平均 30 分钟的 DOTA 游戏延长至 90 分钟以上。 但玩Techies的玩家很少,他们经常专门玩这个英雄。
14、长话短说
- 在线社区正在取代宗教
- 开发工具需要开放的在线社区
- HuggingFace 是机器学习初创公司的一个很好的可重复案例研究
- 玩得开心,交朋友,LARP 更多
15、结束语
上述大多数想法在游戏开发者中都是众所周知的,但最近在开源社区中变得更加明显。 HuggingFace 可能是最拥护上述所有内容的机器学习公司。
我一直想写更多关于游戏开发者的文章,以及我们在构建其他类型的软件业务时可以从他们身上学到什么。 因此,请继续关注(如果这听起来很酷)。
原文链接:The Rise of HuggingFace 🤗
BimAnt翻译整理,转载请标明出处