他刚融了27亿,李飞飞也投钱了
在当下的创投市场里,“世界模型”毫无疑问是热词中的热词。我们几乎每天都能看到有新的“世界模型”公司完成融资,估值增长迅猛,股东列表豪华。并且在这些融资新闻的通稿里,人们还会反复地强调一个事实:一个合格的超级智能体不应该只靠数据投喂来获得能力,而是要像人类那样去主动理解物理世界。
但皮特·弗洛伦斯(Pete Florence)却在创业之后写了一篇长长的公开信,一开头就写到:“不要将我的公司,贴上世界模型的标签。”
这真是倒反天罡。因为皮特·弗洛伦斯可不仅仅是一个“创业者”这么简单。在创业之前,皮特·弗洛伦斯一直在谷歌DeepMind团队工作,一路从普通研究员升级到了高级研究科学家。2025年DeepMind发布的机器人控制模型Gemini Robotics,皮特·弗洛伦斯就是最核心的开发者之一。不过在此期间他最有影响力的就成,就是在2023年与他的同事们一起,向全世界介绍了一个全新的机器人模型架构“Vision-Language-Action Models”。
(皮特·弗洛伦斯,来源:社交媒体)
是的没错,如果说当下“世界模型”或者“VLA”是最前沿、最具共识的方向,那么皮特·弗洛伦斯就是这条路上当之无愧的先行者。这样的人带头扔掉“世界模型”的标签,实在是太冲击了。
而现在,冲击感加倍了。近日,皮特·弗洛伦斯创办的具身智能公司Generalist AI完成了一轮新融资,总规模为4亿美元(约合人民币27亿元),估值为20亿美元(约合人民币135.5亿元)。本轮投资方包括英伟达旗下的NVentures、知名天使投资人纳特·弗里德曼(Nat Friedman)和丹尼尔·格罗斯(Daniel Gross)共同管理的NFDG、贝索斯的家族办公司Bezos Expeditions,还有小米联合创始人林斌、Zoom创始人袁征,以及世界模型领域内最具代表性的科学家李飞飞。
“目标”比“标签”更重要
为什么作为世界模型的主要奠基者之一,皮特·弗洛伦斯如此抗拒贴上“世界模型”的标签?为什么李飞飞作为世界模型领域最有代表性的学者,却用真金白银支持了这样一位公开“离经叛道”的异端?故事或许要从2019年讲起。
那个时候的皮特·弗洛伦斯正在麻省理工大学攻读计算机科学博士,主要研究方向是机器人操控、计算机视觉和自然语言处理等领域——从这层出身来看,皮特·弗洛伦斯堪称“根正苗红”,研究方向正统、学术背景也很正统,并不是一个需要依靠“特立独行”来争取资源的“江湖儿女”。但问题在于,麻省理工却给他分配了一位叫做拉斯·泰德雷克(Russ Tedrake)的导师。
拉斯·泰德雷克是谁?首先,他肯定是学术大拿。在2019年,他分别担任麻省理工大学电气工程与计算机科学教授、计算机科学与人工智能实验室机器人中心主任。每年到了著名的DARPA机器人挑战赛,他还要负责带领麻省理工校队参赛。在校外,他还兼任丰田研究院机器人研究中心的副总裁。可以说,拉斯·泰德雷克是机器人领域内最顶尖的学者之一,有充足的资源帮助年轻的皮特·弗洛伦斯兑现自己的学术梦想。
然而在拉斯·泰德雷克的自我认知里,让他着迷的并不是编程代码,而是“物理”。在一篇自我介绍里,拉斯·泰德雷克回忆说,自己之所以踏上了计算机科学的学术道路,一切源于自己在研究“双腿直立机器人”的时候,看到了“丰富动力学特性”,让他对“复杂流体动力学控制”产生了浓厚的兴趣。因此相比于其他研究者在入行的时候,会首先去研究如何让机器人抓苹果、叠被子,他首先研究的课题是如何控制“失速后的飞行器或扑翼飞行器”,如何“高速穿越密集障碍物”。
这样的背景,注定了拉斯·泰德雷克非常重视“理解物理世界”这件事。麻省理工官网上如是介绍拉斯·泰德雷克的学术特点:“该教授的研究重点在于为有趣的(欠驱动、随机和/或难以建模的)动力系统寻找优雅的控制解决方案,并能够构建这些系统进行实验验证。他尤其关注力学(特别是非光滑力学)与机器学习/优化理论之间的联系,从而为复杂机械系统实现鲁棒控制设计。”
皮特·弗洛伦斯耳濡目染,自然也成为了计算机科学中的“物理派”。比如博士期间最有代表性的学术成果,就是一篇题为《视觉运动策略学习中的自监督对应》。这篇论文提出,他们找到了一种方法通过模仿学习,可以让机器人用仅仅50次演示就能完成具有挑战性的操作任务,还能能够对不同类别的物体进行泛化,适应可变形物体的构型。这篇论文也因此获得了2020年度IEEE(国际电气与电子工程师协会)机器人与自动化领域最佳论文奖。
当然属于什么“派”不重要,重要的是皮特·弗洛伦斯在这种环境的影响下,拥有了迥然的思考方式。大量研究者习惯现有技术,再通过实验来得出技术的可能性,最后再确定技术的落地场景。而皮特·弗洛伦斯相信正确的顺序应该是“先设置具体的目标”,再设计技术路径。
加入谷歌DeepMind团队后,皮特·弗洛伦斯正是沿着这一方向开展了自己的工作,其第一个代表作就是2021年谷歌推出的初代机器人模型架构Transporter Network。在模型发布的论文中,皮特·弗洛伦斯说整理物品本应该是一项非常基础的技能,但对于机器人来说完成这个动作意味着“高层次和低层次的感知推理”,需要先后考虑考虑书应该放在哪里,以及按照什么顺序堆放,同时还要确保书的边缘彼此对齐,形成整齐的书堆。
Transporter Network正是旨在“让简单的动作变得简单”而推出的模型架构,可以让机器人通用地基于视觉去完成各种操作,训练速度快,对训练环境依赖性也更低。
2023年与DeepMind团队共同发布VLA架构,也正是基于这一思路的“顺水推舟”。在那篇开启了如今世界模型盛世的论文中,作者们表示他们希望VLA架构能够“显著提升对新物体的泛化能力、能够解读机器人训练数据中未出现的指令(例如将物体放置在特定数字或图标上),以及能够根据用户指令进行基本的推理(例如拾取最小或最大的物体,或拾取距离其他物体最近的物体)”。
再回到开头的问题,作为世界模型的主要奠基者之一,皮特·弗洛伦斯如此抗拒贴上“世界模型”的标签?答案也是这样:皮特·弗洛伦斯认为“目标”比“标签”更重要。
在他看来目前关于世界模型的热情,实际上是“理念驱动型”的,比如相当一部分热情,可以归结为资本市场在大热方向上发现非共识的兴奋。并且如果想要真正地推动机器人进入我们的工作生活,创造生产力,那么构建“世界模型”显然不是一个目标。真正的目标实际上应该是机器人能够以极高的成功率和速度完成从未见过的各类任务,且完全无需任何特定任务的数据。
而这也正是皮特·弗洛伦斯决定离开谷歌DeepMind,独立创业的原因。2025年英伟达GTC大会上,皮特·弗洛伦斯首次作为Generalist AI的联合创始人兼首席执行官出现在人们的视野当中。他说:“我们决心制造出能够做任何事的机器人……试想一下,如果体力劳动的边际成本降至零,那会是怎样一番景象。”
99%的成功率
除了技术理念上的“离经叛道”,皮特·弗洛伦斯的创业之路也显得很非主流。
理论上,拥有如此履历的创业者,在当下必然会受到VC们的热捧。杨立昆、伊利亚·苏茨克维、米拉·穆拉蒂都是例子,都是公司刚一注册成立(甚至没注册)就完成了超过10亿美元的种子轮。但皮特·弗洛伦斯的Generalist AI在起步阶段只接受了英伟达、贝索斯家办、NFDG等少数几家机构的投资。如果不是英伟达的风投部门NVentures在2025年的GTC大会上组织了一场“被投企业圆桌”,大家都不知道这人已经离职创业了。
为什么会这样?最可能的答案,就是皮特·弗洛伦斯的主动选择。正如上文所提到的那样,皮特·弗洛伦斯一毕业就进入了谷歌DeepMind团队,从2019年一直干到了2025年,中间再也没有其他的工作履历。也就是说,Generalist AI是他人生中的第一段创业经历,是完全有必要慎之又慎的。
事实上,在第一次以创业者公开亮相的2025年英伟达GTC大会上,皮特·弗洛伦斯就非常直观地表现出了自己的“谨慎”。除了告诉大家自己在造“机器人”之外没有透露任何具体的业务方向,直接表示“我们目前仍处于隐秘状态”。
直到2025年11月,人们才第一次看到Generalist AI的具体业务。2025年11月,Generalist AI发布了他们的初代具身智能模型GEN-0。在官方介绍中,Generalist AI表示GEN-0融合了视觉模型与语言模型的优势,并同步完成了超越——Gen-0能够捕捉人类级别的反射能力和物理常识。
简单来说,它能够随着模型规模和训练数据的增大而持续提升能力,突破了以往小型模型的瓶颈;它可以像人类一样边思考边行动,在真实物理环境中做出快速而自然的反应;它天然适配不同类型的机器人,无需额外改造;更重要的是,它依托海量的真实操作数据,不再受数据匮乏的制约,并且通过灵活调整训练数据的构成。大量科技媒体指出,GEN-0证明了驱动ChatGPT等大型语言模型的数学“扩展规律”也适用于物理运动。
不过GEN-0并不是完美的。例如GEN-0也并没有解决困扰具身智能领域的数据集问题。因此到了2026年4月,Generalist AI迅速迭代到了全新的版本GEN-1。
(“机械手”,来源:Generalist AI社媒)
为了解决数据集问题,Generalist AI开发了一款可穿戴设备,用于捕捉人类执行手工任务时的微小动作和视觉信息。Generalist AI表示在开发GEN-1的过程中,他们通过这对机械手收集了超过50万小时的“PB级物理交互数据”,用于训练其物理模型。在得到充分训练后,GeneralistAI表示GEN-1在折叠纸箱、打包手机和维护扫地机器人等重复性但精细的机械任务上,成功率高达99%,速度约为上一代GEN-0型号的三倍,并且只需花费大约一个小时的时间就可以达成这一目标。
由此,Generalist AI骄傲的宣布,GEN-1的物理模型已经接近类似GPT-3的拐点,一些任务的性能开始“达到在商业实用环境中部署所需的水平”,并且“我们可以预期每一代新模型都会带来一系列日益复杂的新任务,这些任务都可以被掌握”。
在官方博客中,皮特·弗洛伦斯则指出,GEN-1的开发过程是他个人技术理念的最好诠释:首先,他设置了一个理性的目标,即机器人能够以极高的成功率和速度完成从未见过的各类任务,且完全无需任何特定任务的数据。接着基于这个目标设定了一个解决路径,允许针对特定任务使用少量机器人数据(称之为X),并实现该任务的高水平执行,然后不断减小X,同时提升性能。
聊到这里,前面我们提出的那个问题也得到了回答。Generalist AI所开发的产品到底叫不叫“世界模型”已经不重要了,只要你看到具身智能行业,看好机器人能够大规模地进入实际生产当中,那么Generalist AI确实是值得下注的选择。而Generalist AI这一轮融资也确实是在GEN-1发布之后的两个月内迅速敲定的。
根据报道,老股东英伟达、贝索斯家办Bezos Expeditions、NDFG全部选择了复投,并且是加倍复投。除此而外,新晋投资者包括小米联合创始人林斌、Zoom创始人袁征,华人科学家李飞飞,也包括Radical Ventures、8VC、Union Square Ventures、Hanabi Capital、Norwest这些机构投资人。
换句话说,2026年6月的皮特·弗洛伦斯已经不需要再证明自己了。最起码那些年他吹过的牛逼——比如2025年刚刚创业的皮特·弗洛伦斯曾经在一档播客中说:“通用机器人不是样样都浅尝辄止,而是要在真实任务上专业到足够有用”——已经走在“一一兑现”的路上了。
本文来自微信公众号“投中网”,作者:蒲凡,36氪经授权发布。















