
一家数据标注公司,估值追上百度和理想汽车

最新估值 2000 亿
Fast Reading
■
数据标注公司 Scale AI 在 2024 年的营收为 8.7 亿美元,Meta 出资 143 亿美元获得其 49% 股份,将它的估值一举推高到了 290 亿美元。
这家公司的真正优势在于,它已经从一家单纯的数据标注公司,一跃成为能够深度参与数据管理与模型训练流程的数据基础设施企业。
买数据、挖情报、抢人 ......Meta 通过对 Scale AI 的收购,已经将硅谷的 AI 大战带到了新的高度。
作者 | 于米
一提到 " 数据标注公司 ",外界的印象通常是:
技术含量低、工作内容重复枯燥、依赖大量低成本人力完成简单机械的标注任务,例如给图片打标签、文本分类或音频转录。这类公司被视作 AI 产业链底层 " 苦力 ",利润微薄、附加值低,很难形成核心竞争力或行业话语权。在公众眼中,它们更多是幕后无名的外包工厂,而非高科技创新企业。
不过,随着一笔硅谷投资交易浮出水面,你可能要重新构建对数据标注公司的价值评估了。
据多家媒体报道,6 月中旬,Facebook 母公司 Meta 出资 143 亿美元(约合人民币 1028 亿元)获得数据标注公司 Scale AI 的 49% 无投票权股份,将后者的估值一举推高到了 290 亿美元(约合人民币 2082 亿元)。
你可能对 290 亿美元的估值没有概念。截至 6 月 20 日收盘,百度和理想汽车的市值分别是 287.5 亿美元和 263.6 亿美元。
这是 Meta 历史上第二大投资,仅次于 2014 年以 190 亿美元收购 WhatsApp。作为交易的一部分,Scale AI 创始人兼 CEO Alexandr Wang 在保留原公司董事会成员身份的同时,也将携部分公司成员加入 Meta。
Scale AI 创始人 Alexandr Wang
图源:Scale AI
一石激起千层浪。
得知这一消息后,包括谷歌、微软、OpenAI、马斯克的 xAI 等在内多家 AI 巨头先后表示计划撤出与 Scale AI 的合作。而 Scale AI 空出的订单,正被一众同行疯抢。
一家数据标注公司何以卖出千亿,Meta 这次的大动作背后,藏着多少 AI 巨头们残酷争斗的暗线?
何以估值 2000 亿?
算力是 AI 军备竞赛中的关键战略资源。要下场做大模型就得囤显卡,已然成为了一个共识。但易为人忽视的是,训练数据的质量决定了模型能力的上限,它与囤卡同样至关重要。
打个比方,如果说大模型是一个勤奋的学生,训练数据就相当于它的教材。只有给大模型投喂高质量的数据,大模型才能够给出真实、准确、全面和符合伦理的回答。反之,则会越学越糊涂,无法提供符合预期的输出。
流传于业内的一句俗语说," 垃圾进,垃圾出 ",说的就是这个道理。在 Scaling Laws 逐渐失效,靠算力和模型规模硬解的打法陷入瓶颈的当下,提高数据质量有时甚至能起到点石成金的奇效。
以往,数据标注工作主要集中在文本、图像和音视频等方面。但现在的数据标注开始变得更为复杂。随着行业转向带有 " 思维链 " 的推理模型,专家数据成为了 AI 巨头们眼中的金矿。
OpenAI 等 AI 巨头转向推理模型,使专家数据成为关键资源
图源:unsplash
这也是为什么如今的 AI 标注团队里,你不仅能看到完成单调原始工作的合同工和外包人员,有时也会看到不同学科和领域的专业人士。他们会写下解决复杂问题所需要的思考步骤,辅导大模型模仿人类的思考方式。
Scale AI 的商业模式,正是为客户提供数据标注解决方案。通过 Remotasks 和 Outlier AI 这样的平台,他们招募并管理着全球数以十万计的劳动力。同时,他们也开出不菲的时薪来吸引计算机科学、数学、自然科学、社会科学等专业的博士来撰写语料。
但若只是如此,Scale AI 和市面上其他的数据标注公司并没有形成差异。
这家公司的真正优势在于,通过 AI 辅助的自动化标注能力和成熟的平台体系,他们能够高效且灵活地满足不同客户的定制化需求,从一家单纯的数据标注公司,一跃成为能够深度参与数据管理与模型训练流程的数据基础设施企业。
Scale AI 目前的业务重心是生成式 AI 所需要的数据
此前,Scale AI 已经赢得了 Meta、OpenAI、Google、微软和美国政府等大金主的订单。这些顶级客户不仅为 Scale AI 带来了不菲的收入,也为之提高了声誉,给估值的水涨船高提供了背书。
2024 年,Scale AI 的营收达到 8.7 亿美元,其估值在与 Meta 的交易之前就来到了 140 亿美元。
Meta 下场,谷歌们 " 割席 "
Meta 拿下 Scale AI 的 49% 股份,最显而易见的收获当然是后者在数据标注业务上的能力。
有了 Scale AI 的加持,Meta 可以依托前者现有的平台,建立起一个大型的高质量数据标注网络,助力自家大模型 Llama 的开发。
今年 4 月初,Meta 发布了最新开源大模型 Llama 4,可它却完全没有了前代产品的惊艳,不但在实测中表现平平,甚至还被爆出了疑似在基准测试中作弊的丑闻。而其旗舰模型 Behemoth 一再推迟发布,至今难产。
Llama 4 的发布计划中包含 Behemoth、
Maverick 和 Scout 三款模型
图源:Meta
如果能够通过训练数据质量的提升来改善模型的真实水平,或许可以拯救 Meta 在开发大模型这一战线上的颓势,缩小与 OpenAI 和 Anthropic 等对手的身位差距。
不过,光看这一点,可能还无法解释 Meta 为何愿意按照 Scale AI 一年前估值(140 亿美元)的两倍来出价,尤其是考虑到从 2023 年到 2024 年,Scale AI 的营收不过从 7.6 亿美元提高到 8.7 亿美元。
有业内人士猜测,除了抢占大模型训练数据这一座山头之外,Meta 对 Scale AI 的这笔大额投资,其实还有通过 Scale AI 了解对手研发动态的目的。
正如 Handshake(Scale AI 的竞争对手)的 CEO Garrett Lord 所说:" 如果你是通用汽车或丰田,你不会希望你的竞争对手走进你的制造工厂,看你的流程是如何运转的。"
虽然 Scale AI 作为一家数据标注公司无法接触到大模型的核心算法,但他们有机会从接触到的数据和产品模型对客户的商业战略和研发重点进行了解。
可能正是出于这样的担忧,尽管 Scale AI 的发言人 Joe Osborne 在一份声明中表示 " 公司将继续保持独立 ",多家主要客户(包括谷歌、微软、OpenAI、马斯克的 xAI 等)都决定退出与 Scale AI 的合作。
Scale AI 在其官网列出的部分客户名单
这其中,谷歌作为 Scale AI 的最大客户,原本计划在今年支付 2 亿美元购买人工标注数据。去年 Scale AI 8.7 亿美元的营收中,谷歌一家就贡献了 1.5 亿美元。
AI 巨头们果断切割的想法其实很好理解,与 Scale AI 的合作涉及高度敏感的商业机密,他们不可能放心将这些交给 Meta 大额持股的公司。
当下,各家数据标注公司还在鲶鱼抢食,冀望吃下 Scale AI " 被分手 " 以后空出的订单量。Handshake 一夜之间订单量激增到原来的三倍,Labelbox 的 CEO 则表示,该公司可能会从 Scale AI 的老客户那里获得数亿美元的收入。
Scale AI 将如何度过这一波用户流失潮,目前还不得而知。但这笔交易可能会成为数据标注行业的转折点。可以预见的是,AI 巨头们要么会加大投入去养自家的数据标注团队,要么就会将需求分散到多家供应商。
无论哪种模式下,数据标注行业或许将很难再滋养出一家超大公司—— AI 巨头们不会允许自己的数据供应链被一家独大的供应商拿捏。
AI 大战来到新高度
仅从账面上看,Meta 花费如此大的代价投资 Scale AI,算不上是一笔好买卖。
Scale AI 原本被看好在 2025 年实现 20 亿美元的营收,但在流失了多家重量级客户之后,哪怕汽车自动驾驶和政府业务相关的客户全部留下,要达到这一业绩也难度颇高。
而其 290 亿美元的天价估值,也将在对客户的吸引力下降后冷却下来。有媒体报道称,Scale AI 的一位早期投资者已经萌生了套现离场的想法。
很难想象 Meta 会对这样的业界反应毫无预料,但或许从一开始,Meta 就没有带着要在财务投资中获利的心态去做交易。
Meta 真正的意图是什么?他们想要的不仅是 Scale AI,还有 Scale AI 背后的领路人 Alexandr Wang。
Alexandr Wang 是 AI 圈最受关注的年轻企业家之一
图源:Entrepreneur
类似的 " 招聘式投资 " 近些年在硅谷早有先例。
去年,微软花费 6.5 亿美元,换来 AI 初创公司 Inflection 的软件授权,并聘用了该公司包括老板 Mustafa Suleyman 在内的大部分员工。在一笔类似的操作中,谷歌以逾 20 亿美元的估值投资 Character.ai,好让后者团队中的 30 人加入 Gemini 的开发。
对于规模庞大、组织僵化以至于缺乏创新土壤的大公司来说,直接以这种方式引入经过市场验证的人才,也不失为一种破局的手段。
Meta 确实也十分看重 Alexandr Wang 的加盟,他们一度想授予这位年轻人 " 首席 AI 官 " 的头衔。接下来,Meta 计划让他担任新部门 " 超级智能(Superintelligence)" 的高级岗位,直接向扎克伯格汇报。
有趣的是,虽然 Alexandr Wang 即将成为 " 超级智能 " 实验室的领导者,但他却并非科班出身的研究人员。
2016 年,年仅 19 岁的 Alexandr Wang 在用 AI 摄像头来监控冰箱库存的尝试中,发现了 AI 数据标注的巨大商机,当年他就从 MIT 辍学并创立了 Scale AI。
在经历了初期的探索后,这家公司开始专注于与自动驾驶相关的数据标注工作,随后又开始将业务重心转向生成式 AI。24 岁时,Alexandr Wang 成为全世界最年轻的白手起家亿万富翁。
Alexandr Wang 也以其过人的社交能力在圈内著称,OpenAI 的 CEO Altman 就和他关系密切。Scale AI 能够接连从 AI 巨头和美国政府手里接下订单,与 Alexandr Wang 强大的人脉也不无关系。
Alexandr Wang 出席美国国会听证会
图源:Alexandr Wang 社媒账号
此前,据 Altman 爆料,Meta 曾拿出 1 亿美金的签约奖金到 OpenAI 撬墙角未果。随着 Alexandr Wang 的加盟,Meta 不但完成了一次顶级人才的重磅引进,也给后续继续招兵买马增加了砝码。
在对元宇宙的巨额投资收益惨淡,大模型研发又开始落后于头部对手的当下,Meta 试图通过 " 超级智能 " 弯道超车以夺回 AI 大战主动权,也不失为一次富有魄力的尝试。
买数据、挖情报、抢人 ......Meta 通过对 Scale AI 的收购,已经将硅谷的 AI 大战带到了新的高度。不管接下来还有什么精彩戏码上演,这场大战还远远没有迎来拐点。
封面来源丨 AI 制图