小鹏和特斯拉，谁是“物理AI”的未来？

%title插图%num

定焦One（dingjiaoone）原创

作者 | 陈颐

编辑 | 方展博

一场关于“物理AI”的全球竞赛，正在从PPT走向真实的战场。

这几天，聚光灯打在两家企业身上。

一边是小鹏汽车。11月5日，何小鹏公布小鹏汽车的目标是成为面向全球的具身智能公司，并发布了四个AI应用（小鹏第二代VLA大模型、小鹏Robotaxi、小鹏全新一代人形机器人IRON、汇天飞行汽车）。这意味着小鹏试图告别“造车新势力”的标签，一脚踏入科技前沿的核心圈。

%title插图%num

另一边是特斯拉。11月6日的股东大会上，埃隆·马斯克的万亿美元薪酬激励计划即将接受投票。这份方案的解锁条件，与特斯拉在AI和机器人领域的战略深度捆绑。

如果你觉得这两件事只是巧合，那或许就低估了这股席卷全球的“物理AI”浪潮。英伟达CEO黄仁勋多次在公开场合断言“物理AI”就是AI的未来。当这位手握全球AI算力命脉的“军火商”都如此笃定时，一个问题随之而来：

在“物理AI”的赛道上，中国科技公司将如何抓住机会、突破卡位，给出“中国解法”？

一部分目光聚焦在小鹏身上。乐观派认为，小鹏正在以一种更系统的方式，复制甚至超越特斯拉的成功路径，试图在全球智能产业的牌桌上，为中国争夺一个关键席位。

保守派则担心，从“造车新势力”到“全球具身智能公司”，跨度之大、挑战之多，意味着小鹏的技术积累、资源投入与生态构建能力，都将面临前所未有的考验。

当“物理AI”成为科技圈新的集结号，小鹏的物理AI布局，是真正踩在了产业变革的鼓点上，找到了一个比特斯拉更落地的“中国答案”，还是一场虽然美好、却落地艰难的资本游戏？或许，在理解了小鹏构建的“物理AI”版图后，答案就会变得清晰。

物理AI，为什么是AI的终极战场？

最近被科技圈捧上神坛的“物理AI”到底是什么？它和我们熟悉的ChatGPT这类生成式AI，又有什么根本的不同？

ChatGPT靠“吃”互联网上的海量信息为生，能陪我们聊天，能写诗、作画。但它终究是一个关在瓶子里的“超级大脑”，无论多聪明，也不能帮你倒一杯水。

物理AI则不同，它有眼睛（摄像头）、有耳朵（传感器）、有大脑（AI模型），更有能交互的手和脚（机械臂、车轮）。关键是，它能从“瓶子”里走出来，进入复杂的物理世界，像人一样“思考”和“行动”。

我们以一个司机开车的场景为例，感受物理AI的完整闭环：

当你的眼睛“看见”前方的红绿灯和行人，大脑会“看懂”它的含义——红灯意味着停止，行人可能会过马路。这就是感知与理解。

紧接着，你注意到一个皮球滚向马路，瞬间预判到可能会有孩子追出来，于是，你决定提前减速。这就是预测与决策。

最后，你的脚踩下了刹车，车速平稳地降了下来。这就是行动与交互。

从“看见”到“看懂”，再到“预判”和“行动”，这套行云流水的操作，正是物理AI追求的终极目标：让机器能自主、安全地完成这个闭环。

下一个问题是，为什么从黄仁勋、马斯克到何小鹏，这些身处牌局中心的玩家，会不约而同地押注物理AI？

因为AI的价值，终究要落在改造物理世界上。无论是自动驾驶、工业制造还是家庭服务，最终都需要AI能指挥机器，在现实世界里“干活”。

AI一旦跨过这道坎，它就不再是飘在云端的工具，而是会成为像水和电一样的基础设施，重塑整个实体经济。对于中国而言，这更是我们从“制造大国”迈向“智能强国”，必须抢占的战略制高点。

看清了这一点，我们再去看特斯拉，就会发现它最厉害的，不是电池或电机，而是被马斯克反复提及的“世界模型”（World Model）。这套模型就像一个通用的AI大脑，既能训练自动驾驶汽车，也能调教Optimus人形机器人。

以自动驾驶为例，这个“世界模型”本质上是为AI司机创造了一个虚拟驾校。这个模拟世界可以生成任何可能的极端路况，让AI司机“练车”。按照特斯拉的说法，AI在一天之内就能学习相当于人类几百年驾驶时长的经验。特斯拉的AI就是通过这种方式以指数级的速度迭代。

既然有玩家在先，我们还需要完全自研吗？答案是肯定的，原因有二。

第一，是数据主权。智能汽车和机器人，本质上是移动的、全天候的“数据采集器”。它们所“看见”的道路环境、工厂布局，乃至家庭隐私，相当于数字时代的国土疆域。将这等规模的敏感数据交由他国公司处理，无异于将命脉交予他人之手。

第二，是产业主导权。物理AI，很可能就是下一代智能终端的“操作系统”。如果我们在别人的地基上盖房，那就意味着，将利润最丰厚、最具话语权的核心技术让给他人，自己只能做应用层的组装和集成。

更何况，特斯拉的“世界模型”源于其获取的全球数据，而中国拥有全世界最复杂、最独特的道路场景和用户习惯，需要更好地理解并建模中国特有的物理环境。

%title插图%num

可见，物理AI之争，超越商业与技术本身，它是一场关于国家产业安全与未来发展战略主动权的竞争。在这场战争中，中国必须拥有自己的核心技术和领军企业。那么，谁能扛起这面大旗？

小鹏的三张技术底牌

最近，市场的目光聚焦在小鹏汽车身上。在2025年小鹏科技日上，小鹏一口气发布了四个AI应用：小鹏第二代VLA大模型、小鹏Robotaxi、小鹏全新一代人形机器人IRON、汇天飞行汽车。看似是跨行业，其实是为“物理AI”一个目标服务。

要让AI进入复杂物理世界，首先要面对的问题就是AI如何思考、如何反应。小鹏给出的解决方案是第二代VLA大模型，它最核心的特点，是让AI拥有“直觉”。

还是以前文提到的司机开车的场景为例，一个经验丰富的司机看到路边滚出的皮球，会下意识地踩下刹车，这个过程几乎没有复杂的逻辑推理。但传统的自动驾驶AI却做不到。它需要先“看”到皮球（视觉感知），然后把视觉信息“翻译”成机器可以理解的语言或指令（语言模型），再让系统“理解”这个指令的含义（规划决策），最后才“执行”刹车动作。中间的“翻译”环节，无疑拖慢了反应速度。

小鹏的第二代VLA，就是要拿掉“翻译”环节，采用“视觉—隐式Token—动作”的架构。这里的“隐式Token”可以理解为一种AI内部的、非语言的“心领神会”，让AI从“看到”直接跳到“行动”。这就像是给AI训练出了“肌肉记忆”或“直觉”。它不再需要“思考”皮球的危险性，而是能凭借从海量数据学习到的物理规律，本能地做出反应。

在实际驾驶中，这种“AI直觉”会给用户带来什么改变？总结来说就是，反应更快，驾驶更拟人，不依赖地图时，也能更稳定、自主地驾驶。

例如，在没有高精地图覆盖的次级道路上，小鹏数据显示，其“小路NGP”（在非主干道上的智能驾驶）功能的平均接管里程优化了13倍。同时，小鹏发布的“无导航超级漫游”（Super-LCC）功能，也让车辆在无预设导航路径时，凭借对环境的实时理解进行驾驶辅助。

本质上，小鹏选择的技术路径是，教会AI“凭本能反应”。这是智能体进入物理世界的第一步，也是最关键的一步。

有了能快速反应的“大脑”，物理AI最终要落在能执行动作的“身体”上。小鹏没有为每个硬件都开发一个专门的AI，而是把“大脑”用在三种不同的“身体”上：汽车、人形机器人和飞行汽车。这并非简单的“一芯多用”，而是在培养全能型的“通才”。

%title插图%num

我们可以这样理解：AI在驾驶汽车时学到的经验，比如如何识别红绿灯、如何预判行人意图，可以被无缝迁移到人形机器人身上，帮助它在复杂的商场里规划路径、避开行人。

在这个“跨域同源”的设计下，知识可以共享，经验可以复用，学习效率远高于训练三个独立的“专才”。关键是，这套“一脑多用”的架构，更能解决物理AI落地的关键难题：如何让AI的能力突破单一场景，在复杂的现实世界中灵活应变、举一反三。

接下来的问题是，“大脑”和多功能的“身体”如何高效协同工作？这就触及了最底层的体系，就像我们身体的“神经系统”。小鹏选择全栈自研，通俗地理解，就是打造一套稳定、自主可控的“神经系统”。

我们可以用苹果的例子来理解“全栈自研”的分量。苹果之所以能构建起强大的生态壁垒，核心就在于它自己设计芯片（A系列/M系列），自己开发操作系统（iOS/macOS），自己设计硬件（iPhone/Mac）。这种模式确保了指令从大脑到身体的传递过程中，损耗最小，响应最快。它以此实现了深度的优化与整合。

小鹏的路径颇为相似：从最底层的“图灵AI芯片”，到中间的“操作系统”层“VLA/VLM/VLT大模型体系”，再到上层的汽车、机器人、飞行汽车等硬件，所有核心环节都掌握在自己手中。这确保了其物理AI架构形成一个独立性、完整且不受制于人的闭环。

至此，小鹏的技术版图已经清晰：“直觉式”AI模型+“跨域同源”的多种硬件+“全栈自研”的技术架构。

更落地的“中国方案”

看清了小鹏的技术底牌，一个更现实的问题随之而来：这套架构在行业中究竟属于什么位置？小鹏又打算如何将其推向市场？

答案其实就藏在它的定位上。小鹏强调，它是“中国唯一实现物理AI全栈自研”的企业。

要理解这一点，最好的对标对象是华为。华为的盘古大模型体系中包含了世界模型技术，但其商业模式是向行业提供智能驾驶解决方案与算力服务，本质是向外输出通用能力，目前并不亲自下场制造硬件载体。它的角色，更像是物理AI时代的“英特尔”或“高通”。

而小鹏确实是目前唯一一个展示“多类具身智能载体+统一AI大脑+关键硬件自研”布局的公司。这样做最大的好处就是，能实现深度的“软硬一体”，带来的直接结果是，用户体验更流畅，技术迭代也更迅速。

这条路无疑耗资巨大、难度极高，但一旦走通，所构建的软硬一体生态，也将是别人最难复制和超越的壁垒。

%title插图%num

那么，小鹏这套“全家桶”要怎么“卖”出去？

回顾科技史，任何一个新平台的崛起，都伴随着路线之争。在移动互联网时代，这表现为谷歌和苹果两种模式：谷歌通过开源的安卓系统，联合各大硬件厂商，构建了一个庞大“联邦”；苹果凭借自研的iOS系统与AppStore，打造了一个利润丰厚的“封闭帝国”。

在智能驾驶领域，特斯拉是典型的“帝国”模式，通过“硬件（汽车）+软件（FSD）+数据（全球车队）+能源网络”的垂直整合，构建了封闭生态。在这个生态里，它享受品牌溢价和利润。

小鹏显然不是正面硬刚特斯拉，它更像在构建一个“联盟”。从其最新的两个动作能看出这一意图：

第一招是输出核心技术。大众汽车已确认成为第二代VLA，及小鹏自研图灵AI芯片的首发战略合作伙伴。这步棋很高明：与其让大家重复造轮子，不如让有影响力的玩家先用上自己的“轮子”。这不仅能验证了技术的通用性，更能“借船出海”，在全球范围内快速推广自己的技术标准。

第二招是开源核心工具包。小鹏宣布Robotaxi将开放SDK（Robotaxi业务的核心软件开发工具包），与全球伙伴共建Robotaxi生态，高德地图已加入。

小鹏的商业模式逐渐清晰：对内，通过“全栈自研”保证技术的领先与协同；对外，通过开放技术标准来吸引参与者、壮大生态。它显然不再满足做一家汽车制造商，而是希望成为物理AI时代的“平台服务商”甚至是“规则制定者”。

结语

资本市场，本质上是为“未来”定价的地方。一家公司的价值，不仅取决于当期的财报，更在于未来的想象力。过去，资本市场常将小鹏与其他造车新势力一并看待，如今，随着“物理AI”战略的发布，小鹏的估值逻辑有望从“智能汽车公司”拉升到“全球具身智能平台”。

支撑这个新逻辑的，有三个可见的转变：

一是从“卖车”转向“技术变现”。与大众的合作是一个关键节点，它表明小鹏的AI技术可以作为独立产品产生价值，打开了技术授权这条更高利润的收入来源。

二是从硬件销售到生态服务。通过开源Robotaxi平台，小鹏正在构建一个可持续的服务模式，未来从自动驾驶服务中持续抽成。

三是从“造车”到“造智能体”。其业务范畴已从汽车，扩展至能上天（飞行汽车）、能入地（机器人）的各类智能实体。

当然，这条路走起来并不轻松。小鹏在未来几年需要处理好几个现实问题：

第一是钱和人的分配。自研技术、同时做车、机器人和飞行汽车，每一样都很烧钱，也很依赖顶尖人才。怎么把钱花在刀刃上，确保几个业务都能稳步推进，是首要的课题。

值得关注的是，从小鹏2025Q2财报来看，公司基本面持续向好：毛利率已经连续多个季度正增长，在手现金储备增加到了476亿元。这些数字说明，小鹏在为物理AI大举投入的同时，当下的主业也在加速自己“造血”。更有说服力的是，公司管理层依然维持了第四季度实现盈亏平衡的预期。

%title插图%num

第二是用商业成果说话。再好的技术构想，最终都需要接受市场的检验。小鹏需要持续拿出实际进展，一步一步验证技术蓝图。

从长远来看，科技公司的价值往往建立在两个基础上：一是提前看到方向，二是能坚持走下去。小鹏选的这条路，踩在了AI与实体产业结合的趋势上。接下来就看它能否持续将技术转化为可用的产品，再将产品转化为可持续的商业模式了。

小鹏和特斯拉，谁是“物理AI”的未来？

物理AI，为什么是AI的终极战场？

小鹏的三张技术底牌

更落地的“中国方案”

结语

近期文章

标签

书签