OpenAI 背后的神秘推手!这家公司如何用代码“喂养”AI 巨兽
谁在喂养“AI 巨兽”?
作者|Eric,编辑|伊凡
谁在喂养“AI 巨兽”?
3 月 19 日,OpenAI 在其开发人员 API 上推出了 o1-pro——o1 推理 AI 模型更强大的版本。
所向披靡的 Open AI,正在“创飞”一部分创业公司,只要 Open AI 想做某个业务,就会有一批初创公司宣告倒闭。不过,也有另一批小公司,正在 OpenAI 的生态之下生长。
Turing 原本专注于远程的开发人才招聘,现在成为 AI 代码服务商——即组织工程师团队为 OpenAI 等公司提供代码支持。今年 3 月,Turing 完成 1.11 亿美元的 E 轮融资,公司估值翻倍达到 22 亿美元,在数据标注领域仅次于 Scale AI。
业绩方面,Turing 创始人兼 CEO Jonathan Siddharth 在社交平台高调宣布:公司 2024 年收入增长 3 倍,ARR(年度经常性收入)突破 3 亿美元,并成为“全球增长最快且盈利的 AGI 基础设施公司”。
我们试图从 Turing 的成长故事,挖掘大模型时代下,小企业的生存指南——在做原来业务的过程中,发现了新的机会,迅速切入 AI,瞄准垂直而细分的市场。
Turing:从人才中介到 AI“数据矿场”
Siddharth 的创业故事,充满硅谷式传奇色彩。
2017 年,Siddharth 与斯坦福校友 Vijay Krishnan 创立的机器学习公司 Rover 被收购,这是一家利用机器学习进行深度个性化兴趣分析的公司。第二年,Siddharth 就创立了 Turing,利用 AI 技术为其客户优化人才匹配。
2020 年的疫情期间,Turing 获得迅速发展。因为疫情让许多公司不得不居家办公,同时也需要在线上招聘人才和管理团队,由此对 Turing 产生旺盛的需求。当时,Turing 平台上有上百万的工程师和开发人员。对于雇主而言,使用 Turing 招聘可以节省 50 多个小时的面试时间,匹配成功率高达 97%。
转折点发生在 2022 年。
当时 Siddharth 被邀请到 OpenAI 开会,他本来以为是去讨论招募工程师,去了之后才发现是要谈合作。OpenAI 的研究人员发现,将代码添加到训练数据集中有助于提高模型的推理能力。比如,用 Python 代码解释“如何设计桥梁”,模型更易抽象出工程学原理。
为什么添加代码这么有用?因为代码有着严密的语法和逻辑结构,同时包含了大量的算法、数据结构等知识,有助于 AI 大模型学习到更抽象的语言规律。
在 OpenAI 眼中,Turing 凭借庞大的工程师资源成为理想的“代码矿场”。OpenAI 方面询问 Siddharth 是否可以组建一支程序员队伍完成特定的软件工程任务,以便推动 OpenAI 的下一个项目:GPT-4。
右:Siddharth
“我清楚地记得,他们当时的雄心壮志有多大,”Siddharth 在接受 Semafor 采访时说道。“他们对我们的要求非常高,想在短时间内获得大量数据。”
后来 Siddharth 接受了 OpenAI 提出的合作,一位知情的 OpenAI 前员工透露,Turing 在帮助 OpenAI 提升性能方面发挥了重要作用。
当然,这场合作也为 Turing 开启了全新的业务方向。与 OpenAI 合作以来的近三年里,许多基础模型提供商以及 AI 模型公司都成为了 Turing 的客户,而且其数据标注的能力范围已超越了编程代码领域,逐渐涉及各行业的专业数据。
比如,谷歌就从 2023 年下半年开始跟 Turing 合作。从编程代码任务开始,二者达成了价值数百万美元的合作。
目前,Turing 大约 60% 的收入来自希望训练及提升 AI 模型能力的客户,40% 的收入来自为利用 AI 升级业务的客户提供咨询服务。
“资源 - 效率 - 社区”三板斧,筑牢护城河
随着 Turing 跟 AI 公司的合作逐渐深入,资本也对其产生了兴趣。
Turing 的 E 轮融资,由马来西亚主权财富基金 Khazanah Nasional Berhad 领投,其他参投方包括 WestBridge Capital、Sozo Ventures、UpHonest Capital 威诚资本、AltaIR Capital、Amino Capital 丰元创投、Plug and Play、MVP Ventures、Fortius Ventures、Gaingels 和 Mastodon Capital Management。
这些投资机构之所以押注 Turing,在于它的几大优势。
首先,AI 大模型的整个训练和运行,其实都非常依赖数据标记和数据投喂。
数据标记,其实就是对图像、文本、语音等数据进行标注,以便机器学习模型能够识别和分类这些数据。尽管自动化工具涌现,但数据标注仍高度依赖人类。目前,Scale AI 已经成为头部的数据标注服务商。其拥有庞大的数据标记师团队,大多是来自非洲、印度和菲律宾的廉价劳动力。根据 The information 报道,Scale AI 的年化收入至 2024 年 5 月已经突破 10 亿美元,估值突破 138 亿美元。
不过,人类对大模型推理能力要求在不断提高。大模型除了需要传统的数据标注,还需要代码输入,说白了就是从“体力劳动”转向“脑力协作”。Bloomberg Research 指出预计到 2032 年模型训练市场价值 2470 亿美元,模型推理市场价值 2970 亿美元,总价值超过 5000 亿美元。Turing 就是处在在这一趋势上,即通过代码生成优化大模型的推理能力,资本自然对其抱有期望。
另外,Turing 自身的“资源 - 效率 - 社区”特性,也筑牢了发展的护城河,提升了资本的信心。
资源领域,Turing 拥有覆盖 140 个国家、超 400 万程序员贡献的代码,涵盖金融、生物、制造等垂直领域,能够形成差异化语料库。效率领域,在庞大资源的基础上,Turing 凭借算法能够提升客户跟工程师的匹配效率,降低撮合成本。社区领域,工程师通过贡献代码获得高薪和成长,形成“贡献越多→技能越强→收入越高→吸引更多工程师”的正循环,从而推动 Turing 平台的壮大。
随着大模型的加速发展,资本认为 Turing 凭借这三板斧能够开拓更广阔的成长空间。更何况,AI 基建赛道是个极为烧钱的领域,但 Turing 罕见地实现盈利,这也是吸引资本的重要一点。
DeepSeek 时代:数据标记会消失吗?
虽然 Turing 发展地如火如荼,但很多人质疑其未来的发展空间。
他们认为越来越多的 AI 大模型能自动标技数据和生成代码,比如 DeepSeek 就能对数据进行自动标记和整理,还能通过自然语言描述生成代码。这意味着,Scale AI 旗下的数据标记师、Turing 旗下众多的程序员会面临淘汰风险。
事实上,完全抛开人类实现大模型的迭代是不现实的。
因为模型越复杂,越需要人类进行精准且高效的“数据指导”。比如,自动驾驶模型需要标注极端场景数据,医疗模型需专家验证病理特征,这些都无法完全依靠自动化的机器。另外,AI 生成的代码仍需人类审核与优化。最优秀的 AI 代码生成器,一定由人类编写的代码训练而成。
Siddharth 就描绘了一幅人类和 AI 共同推动大模型发展的图景,比如如果要求大模型分析顶级风险投资公司,它首先会利用金融专业人士的知识了解要寻找哪种数据,然后利用人类的编码知识编写一个脚本,访问相关数据并将其转换为正确的格式,接着做出深度的分析。
Siddharth 表示,OpenAI 的最新模型是给程序员的礼物,而不是生存威胁。
事实上,AI 不是取代人类,而是放大人类的智慧。人类跟 AI 是可以共同协作的——人类进行数据标注和提供专业知识,AI 将其转化为数据和逻辑,二者共同喂养更强大的模型。
数据就是数字化时代的原料,是 21 世纪的石油。当资本疯狂涌入大模型时,Turing 的崛起揭示了一个趋势:
AI 的“灵魂”不止于数据和算法,还在于数据背后的人类痕迹。工程师的每一行代码、医生的每一次诊断,都能成为喂养 AI 的养料。人类和 AI 之间是共生关系,而不是零和博弈。
参考资料:
1、Jonathan Siddharth 的领英
2、Inside the company that gathers ‘human data’ for every major AI firm(Semafor)3、Turing, a key coding provider for OpenAI and other LLM producers, raises $111M at a $2.2B valuation(TechCrunch)
免责声明:文章中的所有内容仅代表作者的观点,与本平台无关。用户不应以本文作为投资决策的参考。
你也可能喜欢
Matrixport 投研:全球流动性上升可能不再推动 BTC 价格上涨
全球流动性与 BTC 价格的关系逐渐减弱,加密货币原生驱动因素或将成为关键指标

重塑金融体系:FDIC改革能否应对加密货币时代的挑战?
美国联邦存款保险公司(FDIC)代理主席特拉维斯·希尔提出了一系列改革优先事项,包括审查现行法规、拥抱创新和重新评估银行合并审批流程。然而,改革面临现实挑战,需要在确保金融体系安全的同时推动经济活力。FDIC 应采取谨慎、分阶段的方式推进改革,以避免监管漏洞和实施延迟。 摘要由 Mars AI 生成 本摘要由 Mars AI 模型生成,其生成内容的准确性、完整性还处于迭代更新阶段。

特朗普儿子参与Dominari的比特币ETF投资
公开上市公司Dominari Holdings宣布采用比特币储备策略,投资200万美元购买黑石iShares比特币信托基金(IBIT)股份。该公司与特朗普家族关系密切,唐纳德·特朗普·朱尼尔和埃里克·特朗普近期加入其顾问委员会。通过受监管的ETF获取比特币敞口,简化合规和会计处理,凸显特朗普家族对加密货币的兴趣和参与。 摘要由 Mars AI 生成 本摘要由 Mars AI 模型生成,其生成内容的准确性、完整性还处于迭代更新阶段。

加密货币价格
更多








