斑马智能蔡明：端侧AI给座舱带来的变化在2026高通技术峰会上，我们现场和斑马智

斑马智能蔡明：端侧AI给座舱带来的变化

在2026高通技术峰会上，我们现场和斑马智能首席产品官蔡明交流，探讨了智能座舱围绕Ai应用产生的变化。从座舱AI的演化逻辑、芯片平台的差异化策略、端侧模型的用户价值、舱驾融合的时间判断，一路聊到全球化和公司战略延展。端侧大模型的部署，正在把智能座舱从一个“服从命令的执行工具”变成“理解用户关系的长期陪伴者”。

● AI Agent不是追风口，是在同一条路上移开一块石头面对AI Agent和座舱龙虾热潮，蔡明说得很直接：“我觉得斑马不是去追这个热点，才来做今天的产品。”回溯到去年9月的云栖大会：“我们在发布AutoOmni时，很明确地提出来：斑马的原生AI一定会覆盖规划迭代型的场景。”

什么叫规划迭代？你和朋友约好晚上开车去吃饭，突然有人说想喝酒。这时候立刻产生两个变化，第一要买酒，第二从开车变成打车。原来的座舱AI遇到这种变化，指令式架构就断了，因为只会执行“导航到餐厅”这一件事。

座舱需要的是在规划过程中，还要根据边界条件的变化实时迭代。这些东西都是实时根据一些边界条件，可能是人的意愿、天气、有人突然说改时间，所以整体规划需要被迭代。这个迭代的前提是，AI能理解这些任务之间的依赖关系。AI的推理能力逐渐增强到一定状况以后，一定会超越现在单任务执行的阶段，踏到多任务的协同以及规划迭代上来。

大模型推理能力的提升是一个不可逆的单向箭头，而一旦推理能力突破某个阈值，从单任务到多任务的跃迁是物理规律式的必然。

● 座舱的三种算力阶梯在芯片平台策略上，蔡明给出了一个分层非常清晰的框架，可能要分三个平台。8295、8X97、9075。再往前可能确实比较难，因为算力不够，在NPU上很难支撑现在模型的本地部署。”◎ 高通8295平台：“将将可以做一些不到1B的模型。场景还是非常受限，适合于很明确规划了几个有限场景的车。但一旦希望有一些丰富的延展、或者任务更复杂一点，基本上8295很难去支持。”

◎ 高通9075平台，外挂AI Box的解决方案，算力在NPU上比8295会好很多。8X97实现的场景里，可能有一半能通过9075的外挂AI Box方式去实现。”

◎ 8X97平台旗舰方案，有效算力能到600多TOPS，带宽270多，对8295差不多四倍。让大模型上车不仅成为可能，而且是比较好的基础，这个平台已经有性能余量了。目前主流部署4B模型，“8B、9B都还是可以的，也在尝试30B或者二十几B的MoE模型，因为激活参数量也就3-4B。”

三层芯片策略对应到了三种价格段，基于8295的是最基本的智能化升级，9075的AI Box是外挂解决方案，最高端的是基于8X97。覆盖了从10万级、20万级到30万以上的不同产品。任务式架构是一样的，只不过部署不同的模型，用户体验有差异。算法架构统一，硬件分层，用户根据价格段获得不同颗粒度的AI体验，不用担心买到“上一代架构”的车。

● “长睁眼、长聆听、善记忆”，端侧模型的用户价值

蔡明对端侧模型用户价值的拆解，把端侧模型的价值总结为三个能力：“长睁眼、长聆听、善记忆” 然后给出了这三个能力之间的因果链条：“因为能长睁眼、长聆听，所以记忆才变得非常有价值。”

一辆车一天你能唤醒几回？可能10回，一次3到5分钟，大部分都不到。一天你真正记忆的东西可能就十几分钟。

没有端侧模型之前，座舱AI的记忆能力几乎等于没开。但如果你今天有了端模型在端侧的部署，它一直在听、一直在观察，而且因为它不出车，所以没有隐私安全问题。

这个时候记忆就真正具有价值，能够记住车主以及家人朋友的各种喜好、需求，以往谈过的东西、本来的计划和规划。

记忆的终点是什么？是主动智能，端模型开启了座舱体验的一个新范式。在没有它之前，你很难做到主动智能。因为没有足够的信息去把握用户需求，去了解现在场景里发生了什么。

他举了一个非常具体的使用场景：“后排有小孩，一开始还挺高兴，一会儿就睡了。那谁知道？是端模型知道，是我们的AutoOmni知道。然后它就能很好的说，空调放小一点，风不要对着孩子吹。

这些能力全在，但为什么能在这个时间点准确释放？核心是因为有了端模型的长睁眼、长聆听、善记忆的能力。”

端侧智能不是一个add-on或者nice to have的事情，是个标配。就像两个人一样，一个人每天接触你15分钟，另外一个人一直陪在你身边。就算推理能力和智能能力一样，谁给你提供的服务会更好？一定是天壤之别。

这个比喻把端侧模型的价值从技术讨论拉回到了用户体验的直觉层面，AI能力相同的前提下，接触时长就是最大的变量。而端侧部署，解决的就是“接触时长”这件事。

● 付费模式：手机已经走过的路，车也会走关于座舱是否会走向付费，蔡明的回答分了两步。◎ 第一步是方向判断，很明确：“服务可以独立形成付费，这个趋势不可挡。但需要一定的过程，体验要做得足够好，latency足够低，沟通越来越自然到用户张嘴就来。”

◎ 第二步是分层逻辑，他把车内服务拆分成了两类。◆ 车控类：比如空调、车窗、导航，第一它的Token消耗会比较有限。随着端模型逐渐发展，它渐渐不消耗云端Token，甚至可以被固定住，消耗打到最低。这部分还是可以跟着车的整体销售包在里面。

◆ 生活服务类：音乐、有声读物、视频、聊天，自然语言对话、很多聊天，你不可能不让人聊，但一上车就聊8小时，Token消耗确实很大。这已经属于个人的了。就像话费一样，有一个标准额度，超过以后需要另外计费。

智能驾驶最终一定是个commodity商品化标品，你不会接受60万的车死亡率0.001%、十几万的车死亡率0.1%。这就像500块和2万块的手机通话质量不会有什么差别。

但智能座舱一定是指向生活的。每个人的生活不一样，意味着使用服务不同、频次不同、时长不同、方向也不同。

智驾是标准化产品，座舱是个性化产品。前者拼的是安全底线和覆盖场景，后者拼的是对个体用户的理解深度。

● 舱驾融合——什么时候“融”比“要不要融”更关键对于行业热议的舱驾融合，蔡明的立场是“会融”，但他花更多篇幅讲的是“什么时候融才成立”。终局来看，一定会融合。随着模型能力的提升，推理能力会cover舱和驾。

硬件上，芯片也一定会发展到把智舱和智驾能力集中在一个芯片系统里。

舱和驾都在快速爬坡的时候，融合在商业上不成立。你原来以为能做到的100分，快速已经被打破了——100分翻了三倍，你做到70分就成20分了。体验不足以有基本竞争力的时候，就没办法谈性价比。

舱驾融合的商业价值，取决于舱和驾各自是否进入了平台期。只有两边的技术爬坡曲线都开始变缓，融合的“降本增效”逻辑才能成立。在那之前，让舱和驾各自用最好的硬件冲到体验上限，是更合理的选择。

座舱模型天然就是多任务的，驾的模型相对是单任务，从模型侧做整体思考和整合的框架我们是具备的。更核心的是舱和驾分别爬坡位置的判断，以及能不能找到真正合适的商业项目牵引。

● 全球化与下一步：从车到机器人在全球化方面，蔡明认为中国座舱有明确的代际优势：“中国智舱最少领先海外市场一到两个代际。国外很多非常成功的车企，已经把中国当作智能化研发的重要力量，是in China for global。”

在出海方面，高通是非常看好和斑马的合作的，从高通这种全球芯片领先企业来看，都会清晰看到中国在模型、软件方面的优势，而且非常期待跟我们来共同形成在全球市场都有竞争力的整合解决方案。

汽车是起点，但不是终点。智能汽车会是最早的机器人。它是一个非常好的赛道，能让斑马把AI技术在一个真实的赛道里锤炼，不断优化，真正解决用户的真实问题。

这个过程中积累的能力，对于其他智能端也有非常好的助力。到那个时候，往其他智能端延展是水到渠成的事情。阿里生态内的协同可能，夸克智能眼镜、天猫精灵硬件。

最早RX5的时候我们提了两句话：‘语音是第一交互，地图桌面是核心’。本质就是一个交互的入口，一个以服务为核心。但那时候自然语言技术被一块石头挡住了。这块石头通过了七八年时间，被这一波AI技术，特别是LLM大模型突破掉了。让我们可以继续在这条路上再往前走。

新能源汽车大v聊车