今天你想看什么

巨头围剿下,中国大模型创业生死存亡战

  中国的大象真的能跳舞。

  文丨王与桐 贺乾明 程曼祺

  编辑丨程曼祺 黄俊杰

  “如何能卖掉部分手里的大模型创业公司股份?”

  今年 10 月上旬一场聊天中,数位投了大模型的投资人到场。惬意的音乐中,他们讨论着这个不算轻松的话题。

  今天希望出让股份的投资人,大半年前还在为争抢份额头疼。当时有一位投资人告诉我们,没有拿到份额的机构 “没资格谈选择”,而他拿到了所有 “第一波大模型” 公司的投资机会,并投到了其中最好的一家。

  现在,悲观的心态在投资人中蔓延:大模型赛道,创业公司可能很难打赢大厂——他们高估了增长拐点到来的速度,也低估了中国大公司的决心与行动力。

  一位大厂高层给出判断,做大模型,“一年低消也要 20 亿-30 亿美元”,这超出任何一家中国大模型六小龙的总融资额。

  当游戏变成需要持久烧钱的拉锯战,天平开始倾倒。

  创业公司与大公司间的攻守易位,发生在不到 12 个月之间。

  中国的大象,真的能跳舞

  “去年字节的 AI 战略是不及格,但完全不影响今年的满分表现。” 昆仑万维创始人周亚辉今天在社交媒体上说,“这符合我对这个组织快速迭代能力(卷死人能力)的预期。”

  不到 12 个月里,字节跳动在大模型上后来居上。

  相比 2023 年 3 月率先发布大语言模型的百度,和 2020 年就研发多模态大模型的阿里,向来看重 AI 的字节并没有跟上大模型的第一声发令枪。

  一位字节人士去年曾告诉我们,在 ChatGPT 横空出世前,字节更看重 AI for Science,“押错了宝”。那之前,约有 100 多人的字节 AI Lab NLP (自然语言处理)组里,只有不到 10 人在研究大语言模型。

  长期观察中国 AI 发展的一位研究人员当时也告诉我们,相比其他大公司,字节去年做大语言模型 “相当于是从零开始”。他推测,字节很有可能收购一家公司,但头部的创业公司里,没一家愿意卖。

  字节大模型研发负责人朱文佳,去年四季度 OKR 的首要目标还是 “让语言模型整体效果达到 GPT-3.5”。当时百度和一批头部大模型创业公司的进度已来到追赶 GPT-4。

  而今年夏天之后,字节大模型口碑迅速翻转,其产品数据和影响力也今非昔比。

  据数据分析机构 QuestMobile,字节豆包 App 今年 9 月的日活已达 760 万,成为中国日活最大的 AI 产品;同为生产力场景的 Kimi 智能助手(Kimi 手机版),同期日活则在 130 多万。

  一位接近豆包的人士称,只要字节想投放,“豆包日活很快就能破千万”。来到 10 月,豆包的日活已达 945 万。

  而去年 11 月,第一还是百度文心一言,当时豆包日活不到 130 万,比文心少几十万。

  从生产力到娱乐陪伴,从对话产品到 Agent 工具再到文生图,字节陆续推出了十几个 AI 应用,饱和式地覆盖了几乎所有主要 AI 产品方向。

  字节还做了 AI 硬件——在今年 10 月推出能与豆包语音对话的 Ola Friend 耳机,近期还在研发 AI 眼镜。

  投流竞争也不是字节的困扰,而是它相对创业公司的优势。字节每年的利润有数百亿美元,比六小龙加起来的融资总额还多几倍。

  同期,一批创业公司进入调整期。我们了解到,今年下半年,至少 5 家大模型创业公司出现人员调整:

  智谱 AI 高峰期有 1000 多人,今年一度缩减上百人,不少交付、销售人员离开;零一万物调整了数十人的团队,集中在产品和运营部门;MiniMax 的商业化和部分产品运营团队总计减员约 50 人;月之暗面则因收缩海外业务,减少 10 余位员工;百川智能也减员约 20 人,主要调整了 C 端产品人员。

  智谱和零一万物回复称,调整业务后,他们也在持续招人,总人数稳定。百川回复称 “我们没有任何裁员”。

  一些技术人才也从创业阵营转向巨头:如字节今年就招募了零一万物原预训练负责人黄文灏,和智谱 AI 的一名资深研究员……还有许多人未浮出水面,字节大模型团队里用花名的人越来越多。

  曾经每个月都有的大模型融资消息,也有近半年不再出现。

  一位投资人感叹:“一般来说,新技术出现时,创业公司的逻辑是用更少的资源、更小的团队,依靠更领先的技术洞察,使产品或服务先一步爆发,以对抗大公司的资源优势,让巨头陷入所谓‘创新者的窘境’。”

  可惜,一个变量的存在——字节跳动,“它这么有资源,又这么努力”,创业公司很难像商学院教材里写的那样 “以灵活与敏捷应战大公司的缓慢”。

  中国的大象真的能跳舞。

  去年冬天,阿里、字节射出反方向子弹

  共同造就如今创业公司过山车轨迹的,是同时酝酿于去年冬天的两种大厂策略。

  经历了 2023 年 2 月王慧文自掏 5000 万美元启动 “光年之外”,到一批新公司涌现,再到光年之外突然被美团收购,AI 大模型的融资水温本已由热转凉。

  一位去年跟踪了 4 家大模型公司的投资人,曾 “辛辛苦苦要到了” 六小龙中某一家的份额,而到下半年,他认为大模型已没有机会:“年初时我见这些 founder,他们还说一年就能追上美国。到年底,大家发现钱不容易拿到,人也挖不来。”

  此时,阿里的激进投资,一举扭转了市场情绪。

  去年底,阿里开始密切接触当时大模型公司中排位相对靠后的月之暗面。当时经过两轮融资,估值来到 8 亿美元的月之暗面已寻求新融资数月。

  原本的交易方案不足为奇:以投前 9 亿美元获得约 1 亿美元融资,潜在领投方是小红书。如果成功,月之暗面会成为中国第 5 家估值超 10 亿美元的大模型独角兽。

  而年底入局的阿里却提出,将投前估值抬到 15 亿美元,小红书此后放弃了领投。

  这笔交易最终在 2024 年春节前谈定,阿里大手笔投资月之暗面近 8 亿美元,持股比例约 40%,月之暗面投后估值来到 23.4 亿美元,与之前的第一,MiniMax 相当。

  这符合阿里云的战略:做智能算力供应商。类似微软与 OpenAI 的组合,阿里用算力加现金,投资了一批大模型公司。

  也是在去年冬天,阿里开始接触 MiniMax,并在今年初投资了约 6 亿美元。

  阿里的出手,改变了创业公司的身位,带来了弹药,也带来了比钱和算力更莫测难求的势能。

  从今年 2 月 8 亿美元融资曝光,到 3 月 Kimi 获得 300% 的用户增速,发布 200 万上下文的长文本新功能,今年上半年,月之暗面一直处于口碑与影响力的上升通道。

  被刺激起 FOMO(害怕错过)情绪的投资机构,也继续贡献着融资。阿里之后,又有源码、高榕等机构投了月之暗面。

  当日历翻过年中,小阳春里的热情很快被巨头的阴影所笼罩。而字节快速包抄的种子,也萌芽于去年冬天。

  当时,一位投资人像往常那样循着 AI 论文去拜访作者,他惊讶地发现:不少人刚和字节创始人张一鸣一对一聊过,这其中还有尚未毕业的博士生。

  他马上和自己投资的一位大模型创始人说:“这是个危险的信号。”

  “这说明字节变了。” 这位投资人认为,那之前,字节的大模型研发主要由朱文佳、李航(AI lab 负责人)等人负责,“他们的精力分配,他们能不能跟上最前沿的技术,都让人怀疑。”

  危险的信号在今年逐渐变成危险的事实。

  字节的 AI 技术骨干持续增加,包括今年 2 月加入的 Google 原 VideoPoet 项目负责人蒋路,8 月加入的零一万物黄文灏,和阿里通义大模型原技术负责人周畅。

  一位接近此事的人士说,当黄文灏提出离职,称要 “奔赴 AGI 梦想”,并讲了字节开的条件时,“他们都不好意思挽留。”

  几位之前就认识周畅,听说他离职后想创业的投资人也告诉我们,当时 “根本约不上”“发消息不回”。

  这很可能是因为,字节的行动比投资人更快。一位接近周畅的人士告诉我们,字节高层也一对一和周畅聊过,并表达了追求顶尖 AI 技术的决心,这更符合周畅的技术抱负。

  一些阿里研发人员曾向我们表达共同的困惑:通义做得很好,为何要用这么多钱和算力支持外面的团队?

  同时,字节也在整合内部力量,快速完善 AI 新部门——Flow。

  我们了解到,Flow 现在已是和抖音、火山、飞书等平级的主要业务部门。

  有数位字节人士告诉我们,如果 Flow 特别想调哪个人,原部门一般会同意。一些分散在字节各部门的产品也在向 Flow 汇聚,如猫箱原属抖音 BG,盒马爱学原属字节教育。

  广义的 Flow 大部门现在有 3 部分:AI 产品团队 Flow,大模型研发团队 Seed,和产品研发支持团队 Stone。

  Flow 部门的总负责人为朱骏,他同时是豆包产品的总负责人。

  留着一头长发的朱骏今年 45 岁,他在字节面对面活动里曾说,自己曾为感受世界而去酒吧驻唱。他联合创立的 Musical.ly 在 2017 年被字节收购,成为抖音产品形态的基础之一。朱骏加入字节后,负责过战略投资、TikTok、产品和战略等。

  与朱骏搭档的 Seed 负责人是朱文佳,此前是 TikTok 产品技术负责人。2015 年,朱文佳从百度加入当时刚成立 3 年的字节,是把深度学习应用到今日头条上的第一批技术骨干。

  朱文佳之下,字节有 4 个主要模型研发方向,分别是:朱文佳百度时期的同事、字节原搜索技术负责人乔木带队的大语言模型,字节智能创作团队负责人杨建朝带队的视觉模型(蒋路即在杨建朝团队),以及王雨轩带队的语音模型。

  新近加入的周畅则将探索一个更前沿的方向——世界模型。“接触过他的人都觉得他很有技术野心。” 一位字节人士说。

  Stone 则于今年下半年从 Flow 产品团队中拆分,向字节工程技术负责人洪定坤汇报。这让朱骏可以更专注于产品的洞察、设计和运营。

  将近 10 个月前,周亚辉曾在社交媒体上评价:“这波 AI 中,字节 AI 战略也就 40 分,还是靠了家底厚……当然以一鸣同学天才般的智力和悟性,Hands on 估计不出 3 月,就会从 40 变 80 甚至 90 分。”

  那时周亚辉预言:“字节的业务战略 vs 阿里的资本战略对决会是一大看点。”

  现在,两种策略确实开始交锋。收束思路、整备团队后,字节的射程逐渐覆盖一批创业公司。

  而创业公司们,也只能带着从阿里那里获得的资金和算力,投入这场艰难的战争。

  不要正面竞争,然后呢?

  创业的一条道理是:不要与大公司正面竞争,尤其是不要在大公司的强项上竞争。

  目前大模型创业的两难是,to C AI 产品仍跳不出移动互联网生态,而字节、腾讯等公司在这里积累已久。

  其中,大公司最擅长,创业公司也绕不开的一个环节就是投放和流量获取。

  第一波投放战争起于今年 3 月。Kimi 智能助手在 “拉一个用户要 20-30 元” 的传闻中实现了 300% 的增速,成为话题中心。

  后来杨植麟告诉我们,其实 Kimi 只有 30% 的增长来自投放,而且称 “我们肯定不是投放最多的”。

  关于投放上到底花了多少钱,各公司面对第三方数据,标准回复是 “不准确”“没这么多”。相对可监测的数据是投放素材量和用户情况。

  据广告营销数据平台 DataEye,Kimi 智能助手 10 月的投放素材超 18 万条,是豆包的 4 倍多。但目前,豆包的日活和月活都更胜一筹,据 QuestMobile,豆包 App 9 月月活为 4200 多万,Kimi 智能助手为 1000 万出头。

  在投放上,字节的可怕之处在于不只有钱,还有效率。

  字节掌握了中国最大的聚合广告投放平台 “穿山甲”,同时有抖音等流量巨大的超级 App。

  从今年 4 月起,抖音 App 就不再接受其它 AI 产品的投放。同时,豆包作为字节系产品,在抖音投放时很可能有折扣。当年字节大力做教育产品时,就有类似的操作。

  “现在创业公司一上来也得去字节买流量,这是最尴尬的。” 一位投资人说。

  投放和流量,只是字节等大公司在移动产品生态里的强项之一。他们过去还积累了产品设计、留存转化和商业化策略等 App 生产链条里的诸多能力。

  据 QuestMobile 数据,今年 9 月,豆包 App 的 30 日留存率 [1] 达到 34.5%,而 Kimi 智能助手和 MiniMax 的海螺 AI 都是约 28%。

  一位月之暗面人士告诉我们,他们在 9 月逐一列出了豆包有,而 Kimi 没有的功能点,开始仔细分析去年还不被视为对手的豆包。

  大公司也在更强势地争取大模型 API 客户。

  AI 儿童玩具公司 Haivivi CEO 李勇告诉我们,此前他们一直用 MiniMax 的语音模型,而当其产品在抖音热卖后,字节联系到他们,称可提供优惠价的豆包大模型 API ,还承诺升级抖音店铺。李勇说,现在 Haivivi 会同时调用 MiniMax 和豆包的语音模型。

  几乎投了所有头部大模型公司的阿里,也是创业公司的 API 和 To B 业务潜在对手。

  阿里是中国最积极做开源大模型的公司。到今年 9 月,其 Qwen 系列开源大模型的总下载量已超 4000 万次,衍生出了 5 万个大模型,仅次于 Meta 的 Llama 系列。

  这可能会让本想购买创业公司大模型 API,或让创业公司定制模型的客户转而投向开源生态。

  我们了解到,去年为大客户定制一个大模型,最高订单额可达 1000 万元,而今年则快速降到了百万元级别,乃至更低。

  在更底层的模型研发上,字节也展现出 “饱和” 进攻的姿态。

  视频生成模型是一个缩影。据了解,月之暗面从去年 10 月就开始做视频模型,起步很早;而在去年四季度朱文佳的 OKR 中,尚看不到视频模型的相关描述。

  到今年 9 月,字节已发布了 2 个视频生成大模型——PixelDance 和 Seaweed,前者来自 AI Lab,后者来自 Seed。字节尚未发布的类似探索还有更多。

  而 MiniMax 视频模型团队只有约 10 人,月之暗面的视频模型团队也是相似规模。MiniMax 在今年 8 月底发布了视频生成模型,月之暗面则至今还没发布。

  投资人也逐渐认清现实:模型能持续比字节好,比开源的也好,而且好得很明显,这很难,最终要赢在产品。

  创业公司可能的出路是:找大厂看不上的、小众的产品方向,或愿意干脏活、累活。

  Kimi 和豆包激烈交战的生产力方向,普遍被认为价值高、智能含量高。而在类 Character.ai 的陪伴和虚拟社交产品上,巨头暂时没拿出那么多火力。

  据了解,Flow 旗下的 “猫箱”,目前日活在 65 万左右,字节另有一款类似产品 “小黄蕉”,已被放弃。而 MiniMax 的 Talkie 加星野的总日活则约有 500 万。

  其中,据 QuestMobile 数据,星野 9 月日活为 94 万,30 日留存率达到 60%,超过猫箱的 44.8%。

  另一条路是等待。

  美团创始人王兴曾说:大多数人以为战争由拼搏组成,其实战争是由等待和煎熬组成。

  一位投资人认为,现在大公司正处在 “上头” 期,但 “一旦一件事干了几年还拿不到结果”,内部张力会涌现,尤其是组织上的拉扯。这时如果创业公司还在场,可能有机会。

  百度已出现了类似的张力。

  在百度,训练基础大模型、开发 to C 大模型产品和提供 to B 大模型方案,分属三个事业群。一位百度人士说,到今年中,当百度模型训练团队希望调动更多算力,训更强的大模型时,会遭遇 GPU 不够用的情况,需要集团高层出面协调——同样是 GPU,放在 to B 业务,马上就有收入,而训练新模型,回报则不明确。

  在字节,我们了解到,一些一线员工并不想转岗去 Flow,因为这是个变动不居、正在 “跑马圈地” 的部门。

  也有字节员工认为豆包是 “ ICU 产品”——离开投放的插管就活不下去。

  近期,字节在与创业公司竞争一位人才时,未能获胜。我们了解到,华为诺亚方舟的一位 AI 研究员已加入月之暗面,将带领团队探索类似 OpenAI o1 的大模型技术。他也曾接到字节邀请,但选了创业公司。

  不过,中国掌握极强产品能力和流量资源的不止字节。微信还没出手呢。

  半熟的技术,半新的战场

  “大模型这么嗨,我也没觉得怎么样,如果不建立自己的商业闭环,只是把悲剧又加速重演一遍。”

  一位 AI 计算机视觉公司创始人今年 3 月对我们说。当时,多个大模型创业公司的估值已突破 100 亿人民币。

  就像如今情形的一场预演,当计算机视觉的商业化场景转向安防后,战争不再发生于创业者之间。真正的威胁来自成立了十几年的安防行业巨头海康。

  创业公司高薪招博士、发论文,更懂 AI 视觉识别,但要从头学习研发硬件产品、搭建营销体系。海康每年卖出数百亿元硬件产品,有完善的供应链和销售体系,对安防需求有长期洞察,但需要引入 AI 技术。

  在这位创业者看来,大模型时代只不过是换了一批创业公司,对手从海康威视换成了资源更多、决心明确的 BAT 和字节。

  上一次,创业公司都没有赢。

  所有依靠新技术的创业,都是在和大公司赛跑——看创业团队先补上完整的商业化体系,还是大公司先学会新技术。

  这一竞赛的结果,取决于新技术能在多大程度上颠覆原有体验,新技术的进入门槛有多高、赛道有多长。

  大模型确实比驱动上一波 AI 热潮的人脸识别等技术有更高的资源门槛,从头训练大模型也是一个更综合、复杂的技术工作,涉及 GPU 调用、模型架构设计、数据处理、调优等多个环节。复杂度远超 AI 视觉。

  技术门槛之外,创业公司和大公司间的竞赛结果,也取决于新技术是否能找到新生态:这里应该有新的供应链、新的硬件载体、新的渠道和新的需求与用户来源。它们尚未被大公司深度染指。

  一位投资人类比了大模型和移动互联网浪潮:移动互联网是新软件、新硬件同时出现,从电脑到手机,带来了 App 的强劲自然增长,当时的流量成本也低得多。

  “现在是新软件有了,还没有新硬件。” 他指在智能手机后,尚没有出现规模足够大、能承载足够多应用的硬件载体。

  但实际上,大模型产品现在的软件也还是 “半新状态”:由大模型支撑的很多产品,仍是一个个 App,模型能力是提升体验的最重要动力,但需求洞察、功能设计,流量和用户获取依然重要。

  这是一个半熟的技术遇上半新的市场的故事。

  尚未成熟的技术,是创业者的机会所在:如果大模型能力还能持续进化,前瞻的技术判断和跟随能力,也许有四两拨千斤的效果。

  半新的市场,则是大公司的砝码:如果大模型能力提升短期遇阻,应用开发和产品表现会更依赖现有移动互联网基础设施,这就是一个烧钱、拼资源的游戏。

  2001 年,成立 3 年的 Google 刚成为雅虎搜索引擎供应商,当时的 CEO 埃里克·施密特(Eric Schmidt)在劝桑德伯格加入公司时说:“如果你得到了坐上火箭的机会,别管是什么位置,上去就行。”

  现在,去年怀着雄心挤上大模型火箭的人,都不得不调整姿态,适应新的现实。

  他们接下来的选择和动作,将不仅关系位置好坏,也关系着公司的生死去留。

  题图来源:《星球大战外传:侠盗一号》