小鹏和特斯拉,谁是“物理AI”的未来?

%title插图%num

定焦One(dingjiaoone)原创

作者 | 陈颐

编辑 | 方展博

一场关于“物理AI”的全球竞赛,正在从PPT走向真实的战场。

这几天,聚光灯打在两家企业身上。

一边是小鹏汽车。11月5日,何小鹏公布小鹏汽车的目标是成为面向全球的具身智能公司,并发布了四个AI应用(小鹏第二代VLA大模型、小鹏Robotaxi、小鹏全新一代人形机器人IRON、汇天飞行汽车)。这意味着小鹏试图告别“造车新势力”的标签,一脚踏入科技前沿的核心圈。

%title插图%num

另一边是特斯拉。11月6日的股东大会上,埃隆·马斯克的万亿美元薪酬激励计划即将接受投票。这份方案的解锁条件,与特斯拉在AI和机器人领域的战略深度捆绑。

如果你觉得这两件事只是巧合,那或许就低估了这股席卷全球的“物理AI”浪潮。英伟达CEO黄仁勋多次在公开场合断言“物理AI”就是AI的未来。当这位手握全球AI算力命脉的“军火商”都如此笃定时,一个问题随之而来:

在“物理AI”的赛道上,中国科技公司将如何抓住机会、突破卡位,给出“中国解法”?

一部分目光聚焦在小鹏身上。乐观派认为,小鹏正在以一种更系统的方式,复制甚至超越特斯拉的成功路径,试图在全球智能产业的牌桌上,为中国争夺一个关键席位。

保守派则担心,从“造车新势力”到“全球具身智能公司”,跨度之大、挑战之多,意味着小鹏的技术积累、资源投入与生态构建能力,都将面临前所未有的考验。

当“物理AI”成为科技圈新的集结号,小鹏的物理AI布局,是真正踩在了产业变革的鼓点上,找到了一个比特斯拉更落地的“中国答案”,还是一场虽然美好、却落地艰难的资本游戏?或许,在理解了小鹏构建的“物理AI”版图后,答案就会变得清晰。

物理AI,为什么是AI的终极战场?

最近被科技圈捧上神坛的“物理AI”到底是什么?它和我们熟悉的ChatGPT这类生成式AI,又有什么根本的不同?

ChatGPT靠“吃”互联网上的海量信息为生,能陪我们聊天,能写诗、作画。但它终究是一个关在瓶子里的“超级大脑”,无论多聪明,也不能帮你倒一杯水。

物理AI则不同,它有眼睛(摄像头)、有耳朵(传感器)、有大脑(AI模型),更有能交互的手和脚(机械臂、车轮)。关键是,它能从“瓶子”里走出来,进入复杂的物理世界,像人一样“思考”和“行动”。

我们以一个司机开车的场景为例,感受物理AI的完整闭环:

当你的眼睛“看见”前方的红绿灯和行人,大脑会“看懂”它的含义——红灯意味着停止,行人可能会过马路。这就是感知与理解。

紧接着,你注意到一个皮球滚向马路,瞬间预判到可能会有孩子追出来,于是,你决定提前减速。这就是预测与决策。

最后,你的脚踩下了刹车,车速平稳地降了下来。这就是行动与交互。

从“看见”到“看懂”,再到“预判”和“行动”,这套行云流水的操作,正是物理AI追求的终极目标:让机器能自主、安全地完成这个闭环。

下一个问题是,为什么从黄仁勋、马斯克到何小鹏,这些身处牌局中心的玩家,会不约而同地押注物理AI?

因为AI的价值,终究要落在改造物理世界上。无论是自动驾驶、工业制造还是家庭服务,最终都需要AI能指挥机器,在现实世界里“干活”。

AI一旦跨过这道坎,它就不再是飘在云端的工具,而是会成为像水和电一样的基础设施,重塑整个实体经济。对于中国而言,这更是我们从“制造大国”迈向“智能强国”,必须抢占的战略制高点。

看清了这一点,我们再去看特斯拉,就会发现它最厉害的,不是电池或电机,而是被马斯克反复提及的“世界模型”(World Model)。这套模型就像一个通用的AI大脑,既能训练自动驾驶汽车,也能调教Optimus人形机器人。

以自动驾驶为例,这个“世界模型”本质上是为AI司机创造了一个虚拟驾校。这个模拟世界可以生成任何可能的极端路况,让AI司机“练车”。按照特斯拉的说法,AI在一天之内就能学习相当于人类几百年驾驶时长的经验。特斯拉的AI就是通过这种方式以指数级的速度迭代。

既然有玩家在先,我们还需要完全自研吗?答案是肯定的,原因有二。

第一,是数据主权。智能汽车和机器人,本质上是移动的、全天候的“数据采集器”。它们所“看见”的道路环境、工厂布局,乃至家庭隐私,相当于数字时代的国土疆域。将这等规模的敏感数据交由他国公司处理,无异于将命脉交予他人之手。

第二,是产业主导权。物理AI,很可能就是下一代智能终端的“操作系统”。如果我们在别人的地基上盖房,那就意味着,将利润最丰厚、最具话语权的核心技术让给他人,自己只能做应用层的组装和集成。

更何况,特斯拉的“世界模型”源于其获取的全球数据,而中国拥有全世界最复杂、最独特的道路场景和用户习惯,需要更好地理解并建模中国特有的物理环境。

%title插图%num

可见,物理AI之争,超越商业与技术本身,它是一场关于国家产业安全与未来发展战略主动权的竞争。在这场战争中,中国必须拥有自己的核心技术和领军企业。那么,谁能扛起这面大旗?

小鹏的三张技术底牌

最近,市场的目光聚焦在小鹏汽车身上。在2025年小鹏科技日上,小鹏一口气发布了四个AI应用:小鹏第二代VLA大模型、小鹏Robotaxi、小鹏全新一代人形机器人IRON、汇天飞行汽车。看似是跨行业,其实是为“物理AI”一个目标服务。

要让AI进入复杂物理世界,首先要面对的问题就是AI如何思考、如何反应。小鹏给出的解决方案是第二代VLA大模型,它最核心的特点,是让AI拥有“直觉”。

还是以前文提到的司机开车的场景为例,一个经验丰富的司机看到路边滚出的皮球,会下意识地踩下刹车,这个过程几乎没有复杂的逻辑推理。但传统的自动驾驶AI却做不到。它需要先“看”到皮球(视觉感知),然后把视觉信息“翻译”成机器可以理解的语言或指令(语言模型),再让系统“理解”这个指令的含义(规划决策),最后才“执行”刹车动作。中间的“翻译”环节,无疑拖慢了反应速度。

小鹏的第二代VLA,就是要拿掉“翻译”环节,采用“视觉—隐式Token—动作”的架构。这里的“隐式Token”可以理解为一种AI内部的、非语言的“心领神会”,让AI从“看到”直接跳到“行动”。这就像是给AI训练出了“肌肉记忆”或“直觉”。它不再需要“思考”皮球的危险性,而是能凭借从海量数据学习到的物理规律,本能地做出反应。

在实际驾驶中,这种“AI直觉”会给用户带来什么改变?总结来说就是,反应更快,驾驶更拟人,不依赖地图时,也能更稳定、自主地驾驶。

例如,在没有高精地图覆盖的次级道路上,小鹏数据显示,其“小路NGP”(在非主干道上的智能驾驶)功能的平均接管里程优化了13倍。同时,小鹏发布的“无导航超级漫游”(Super-LCC)功能,也让车辆在无预设导航路径时,凭借对环境的实时理解进行驾驶辅助。

本质上,小鹏选择的技术路径是,教会AI“凭本能反应”。这是智能体进入物理世界的第一步,也是最关键的一步。

有了能快速反应的“大脑”,物理AI最终要落在能执行动作的“身体”上。小鹏没有为每个硬件都开发一个专门的AI,而是把“大脑”用在三种不同的“身体”上:汽车、人形机器人和飞行汽车。这并非简单的“一芯多用”,而是在培养全能型的“通才”。

%title插图%num

我们可以这样理解:AI在驾驶汽车时学到的经验,比如如何识别红绿灯、如何预判行人意图,可以被无缝迁移到人形机器人身上,帮助它在复杂的商场里规划路径、避开行人。

在这个“跨域同源”的设计下,知识可以共享,经验可以复用,学习效率远高于训练三个独立的“专才”。关键是,这套“一脑多用”的架构,更能解决物理AI落地的关键难题:如何让AI的能力突破单一场景,在复杂的现实世界中灵活应变、举一反三。

接下来的问题是,“大脑”和多功能的“身体”如何高效协同工作?这就触及了最底层的体系,就像我们身体的“神经系统”。小鹏选择全栈自研,通俗地理解,就是打造一套稳定、自主可控的“神经系统”。

我们可以用苹果的例子来理解“全栈自研”的分量。苹果之所以能构建起强大的生态壁垒,核心就在于它自己设计芯片(A系列/M系列),自己开发操作系统(iOS/macOS),自己设计硬件(iPhone/Mac)。这种模式确保了指令从大脑到身体的传递过程中,损耗最小,响应最快。它以此实现了深度的优化与整合。

小鹏的路径颇为相似:从最底层的“图灵AI芯片”,到中间的“操作系统”层“VLA/VLM/VLT大模型体系”,再到上层的汽车、机器人、飞行汽车等硬件,所有核心环节都掌握在自己手中。这确保了其物理AI架构形成一个独立性、完整且不受制于人的闭环。

至此,小鹏的技术版图已经清晰:“直觉式”AI模型+“跨域同源”的多种硬件+“全栈自研”的技术架构。

更落地的“中国方案”

看清了小鹏的技术底牌,一个更现实的问题随之而来:这套架构在行业中究竟属于什么位置?小鹏又打算如何将其推向市场?

答案其实就藏在它的定位上。小鹏强调,它是“中国唯一实现物理AI全栈自研”的企业。

要理解这一点,最好的对标对象是华为。华为的盘古大模型体系中包含了世界模型技术,但其商业模式是向行业提供智能驾驶解决方案与算力服务,本质是向外输出通用能力,目前并不亲自下场制造硬件载体。它的角色,更像是物理AI时代的“英特尔”或“高通”。

而小鹏确实是目前唯一一个展示“多类具身智能载体+统一AI大脑+关键硬件自研”布局的公司。这样做最大的好处就是,能实现深度的“软硬一体”,带来的直接结果是,用户体验更流畅,技术迭代也更迅速。

这条路无疑耗资巨大、难度极高,但一旦走通,所构建的软硬一体生态,也将是别人最难复制和超越的壁垒。

%title插图%num

那么,小鹏这套“全家桶”要怎么“卖”出去?

回顾科技史,任何一个新平台的崛起,都伴随着路线之争。在移动互联网时代,这表现为谷歌和苹果两种模式:谷歌通过开源的安卓系统,联合各大硬件厂商,构建了一个庞大“联邦”;苹果凭借自研的iOS系统与AppStore,打造了一个利润丰厚的“封闭帝国”。

在智能驾驶领域,特斯拉是典型的“帝国”模式,通过“硬件(汽车)+软件(FSD)+数据(全球车队)+能源网络”的垂直整合,构建了封闭生态。在这个生态里,它享受品牌溢价和利润。

小鹏显然不是正面硬刚特斯拉,它更像在构建一个“联盟”。从其最新的两个动作能看出这一意图:

第一招是输出核心技术。大众汽车已确认成为第二代VLA,及小鹏自研图灵AI芯片的首发战略合作伙伴。这步棋很高明:与其让大家重复造轮子,不如让有影响力的玩家先用上自己的“轮子”。这不仅能验证了技术的通用性,更能“借船出海”,在全球范围内快速推广自己的技术标准。

第二招是开源核心工具包。小鹏宣布Robotaxi将开放SDK(Robotaxi业务的核心软件开发工具包),与全球伙伴共建Robotaxi生态,高德地图已加入。

小鹏的商业模式逐渐清晰:对内,通过“全栈自研”保证技术的领先与协同;对外,通过开放技术标准来吸引参与者、壮大生态。它显然不再满足做一家汽车制造商,而是希望成为物理AI时代的“平台服务商”甚至是“规则制定者”。

结语

资本市场,本质上是为“未来”定价的地方。一家公司的价值,不仅取决于当期的财报,更在于未来的想象力。过去,资本市场常将小鹏与其他造车新势力一并看待,如今,随着“物理AI”战略的发布,小鹏的估值逻辑有望从“智能汽车公司”拉升到“全球具身智能平台”。

支撑这个新逻辑的,有三个可见的转变:

一是从“卖车”转向“技术变现”。与大众的合作是一个关键节点,它表明小鹏的AI技术可以作为独立产品产生价值,打开了技术授权这条更高利润的收入来源。

二是从硬件销售到生态服务。通过开源Robotaxi平台,小鹏正在构建一个可持续的服务模式,未来从自动驾驶服务中持续抽成。

三是从“造车”到“造智能体”。其业务范畴已从汽车,扩展至能上天(飞行汽车)、能入地(机器人)的各类智能实体。

当然,这条路走起来并不轻松。小鹏在未来几年需要处理好几个现实问题:

第一是钱和人的分配。自研技术、同时做车、机器人和飞行汽车,每一样都很烧钱,也很依赖顶尖人才。怎么把钱花在刀刃上,确保几个业务都能稳步推进,是首要的课题。

值得关注的是,从小鹏2025Q2财报来看,公司基本面持续向好:毛利率已经连续多个季度正增长,在手现金储备增加到了476亿元。这些数字说明,小鹏在为物理AI大举投入的同时,当下的主业也在加速自己“造血”。更有说服力的是,公司管理层依然维持了第四季度实现盈亏平衡的预期。

%title插图%num

第二是用商业成果说话。再好的技术构想,最终都需要接受市场的检验。小鹏需要持续拿出实际进展,一步一步验证技术蓝图。

从长远来看,科技公司的价值往往建立在两个基础上:一是提前看到方向,二是能坚持走下去。小鹏选的这条路,踩在了AI与实体产业结合的趋势上。接下来就看它能否持续将技术转化为可用的产品,再将产品转化为可持续的商业模式了。