一个多月前,当千寻智能的融资消息接连刷屏时,投资圈子里流行一个说法:所有没投进千寻的机构,都在复盘自己为什么慢了。
4月7日,顺为资本与云锋基金联合领投10亿元,将这家成立仅两年多公司的估值一举推过200亿元大关。而就在2月24日,千寻智能刚刚以近20亿元融资跻身“百亿俱乐部”。30天,30亿元,7轮融资,累计超50亿元——有人说,这是具身智能赛道迄今最密集的资本落点。
如果把这件事仅仅看作一场融资竞赛,那就太小看它了。
紧接着4月下旬,一条更值得细读的消息浮出水面:千寻智能与全球技术与服务巨头博世集团达成集团级战略合作,双方将在数据、模型、核心部件、全球渠道与资本层面全面耦合。博世方面还同步表达了成为千寻智能战略股东的意向。

从红杉、雷军、马云,到产业资本京东、宁德时代,再到如今以博世为代表的国际工业巨头,“财务资本重仓—产业资本接棒—商业化验证”这条逻辑链,正在千寻智能身上完成闭环。
所有深耕具身智能的记者都知道,这个行业不缺合作——发布会上的战略签约几乎每月都有。但博世的入场不一样。这家营收超900亿欧元、拥有140年历史的德国工业巨头,以技术选择标准严苛著称,其集团级战略背书绝非一般商业合作可比,更遑论表达投资意向。
这意味着,站在2026年具身智能由实验室走向多场景、全球化商业化的关键转折点上,博世对千寻智能投下了一张“技术路径+商业化路径”的双重确认票。
市场的好奇心很集中:当几乎所有头部具身智能公司都对接到产业资本时,博世这个级别的合作伙伴为什么选中的是千寻?更进一步问—博世的出牌逻辑是什么?
“脏数据”哲学:一套令博世共鸣的技术方法论
一个多月前的融资潮中,千寻智能讲了很多故事:宁德时代的量产交付、京东的零售落地、创始人团队的黄金三角、数据飞轮的先发壁垒……但真正令博世行动的关键线索,要比这简洁得多。
“Spirit v1.5,超越Pi0.5。”这不是一句商业话术,而是一桩可验证的硬事实。2026年1月,千寻智能自研的具身智能基础模型Spirit v1.5,超越美国明星公司Physical Intelligence的Pi0.5,登顶榜首并同步开源,它也是该榜单上线以来首个击败基线模型Pi0.5的国产具身模型。
当然,任何一个新兴评测平台的榜单排名都会随着参与者的增加而动态变化。但Spirit v1.5带给博世的触动,从来不止于一个名次。真正让这家百年工业巨头下定决心的,是榜单背后一套深刻且极具前瞻性的技术哲学。
“脏数据”才是关键。
2025年以来,具身智能行业长期陷入一个尴尬困境:真实场景数据极度匮乏。尽管截至2025年年底,全国已有超50个国家或省市区级人形机器人数据采集与训练中心投入使用或规划建设,但训练机器人完成某个垂直行业80%的人类工作,至少需要1亿条数据;迈向通用智能更是需要千亿条量级——数据缺口高达4到5个数量级。
行业的普遍应对方式是追求“黄金数据”——在光线恒定、物体规整、任务脚本固定的实验室环境中,由熟练操作员反复录制“干净”的演示视频。这类数据的优点是模型收敛快、Demo效果惊艳,但致命的副作用是:模型在真实世界极其脆弱,遇到遮挡、突发干扰或物体摆放稍有变化就陷入“懵圈”状态。正如千寻智能团队在技术博客中直言:“‘干净’的数据是伟大机器人基础模型的‘敌人’。”
千寻智能选择了一条截然不同的技术路线。团队提出“Dirty data is the key to scaling VLA models”——非完美数据才是扩展VLA模型的关键,主张让机器人像人一样,从现实世界杂乱无章的数据中学习。其“数据金字塔”训练体系创造性地放弃了传统“世界模型”逐帧预测的算力消耗巨大路线,转而基于海量人类互联网视频进行预训练,在更少参数量下实现更好效果,显著降低算力成本。
在预训练阶段,Spirit v1.5引入开放式、多样化的数据采集范式,不再严格限定任务脚本,而以“完成有意义目标”为导向,允许操作过程中自然串联多个子任务与原子技能。模型在训练阶段接触到的不是“理想世界的完美复刻”,而是包含遮挡、失败恢复以及任务之间自然过渡的复杂真实场景。
相关消融实验的数据颇具说服力:在预训练数据规模一致的前提下,基于多样化数据预训练的模型,在新任务上的迁移效率明显高于基于传统演示数据训练的模型,达到相同性能所需迭代次数减少约40%;扩大多样化数据规模后,验证误差仍在持续下降,未出现早期饱和迹象。
目前,千寻智能已累计获取超20万小时多类型真实交互数据(覆盖互联网视频、遥操作、可穿戴采集等维度),预计2026年全年数据总量将突破100万小时。其自研的第五代可穿戴式数据采集设备将采集成本大幅降至传统方式的1/10,数据团队在4月底扩展至千人规模,成为国内最大的具身智能数据采集团队之一。
这一技术路线恰好击中了博世的核心关切。 博世业务横跨汽车与智能交通、工业技术、消费品、能源与建筑技术四大板块,场景差异极大、工况类型庞杂,任何单一场景的定制化方案都难以满足其产业调度需求。
Spirit v1.5展现出的跨形态、跨场景快速适配的“通用大脑”能力,恰好契合博世的底层需求——不是解决某条产线的自动化,而是寻找“一个大脑赋能万物”的底层能力。
一次决定合作的亲眼见证
如果说“脏数据”哲学回答的是千寻智能“用什么训练模型”的问题,那么Spirit v1.5的模型架构则回答了“模型如何思考”的问题。
Spirit v1.5的核心架构是Vision-Language-Action(VLA)统一建模框架。通俗地说,传统的机器人系统通常是一个分步流水线——先让摄像头“看”,再让语言模块“理解指令”,最后让运动控制器“执行动作”。每个步骤由不同模块独立完成,信息在传递过程中逐级衰减,就像一场传话游戏:指令传到最后,往往已经变形。
而VLA框架的不同之处在于,它将视觉感知、语言理解与动作生成纳入同一决策流程,让机器人在一个统一的模型内完成“眼—脑—手”的完整闭环。这带来的直接效果是——当机器人面对一个长程任务(比如“把这些散乱的零件分类放好”),它不需要在“这是零件A”-“零件A应该放那边”-“伸手拿零件A”这三个步骤之间来回切换模块,而是一次性完成从感知到执行的完整推理,信息损耗大幅减少,长程任务中的稳定性明显提升。
2026年3月,这套技术架构迎来了最关键的一场“面试”。博世中国总裁徐大全到访千寻智能,现场观摩了Spirit模型在长程复杂任务中的真机演示:从操作铰链与柔性物体到自然语言指令下的多步操作,模型在多变工况中展现出的稳定性和适应性,远超出预期。

让徐大全印象更为深刻的,是千寻智能自研的第五代可穿戴数据采集设备以及正在规模化运转的“数据工厂”——从采集到训练再到验证的全闭环已处于可工程化部署状态,这正是博世全球场景最需要的“粮草”。
千寻智能联合创始人兼首席科学家高阳曾公开表示:“扩展端到端具身人工智能是一个集体的旅程。”博世从技术旁观者变成了同行者。这场始于榜单初识、经由数据理念深度共鸣、最终在现场考察中拍板的合作决策链条印证了一条规律——在具身智能从实验室走向真实战场的2026年,能征服市场的,从来不是一个漂亮的Demo,而是一套经得起规模化和多样化检验的技术方法论。
新一代通用智慧劳动力的定义者
理解博世入局的深层逻辑,需将视野拉回全球具身智能的大棋局。
2026年1月14日,博世与德国本土人形机器人独角兽Neura Robotics达成战略合作伙伴关系,旨在联合开发面向大众市场的人形机器人。
仅仅两个多月后,2026年4月3日,博世旗下市场化产业投资平台博原资本,与银河通用合资成立博银合创,落户苏州工业园区,投资10亿元建设工业制造场景具身智能机器人研发与产业化基地。
至此,博世在具身智能领域的布局已清晰可见:在中国锁定头部模型公司,在欧洲联手本土整机企业,同时通过合资平台深耕工业场景落地。这是一张“模型能力+整机平台+场景闭环”三线并行的明牌,千寻智能在其中承担“通用大脑”这一核心角色。
而博世之所以在模型层面最终锚定千寻,一个不可忽视的因素在于千寻的“数据飞轮”已先行加速到可规模化的临界点。
此次战略合作的蓝图,远不止一条产线或一个工厂的自动化改造。按照双方构想,这是一个横跨“技术—部件—渠道—资本”四重飞轮的全方位耦合。

在数据与训练闭环层面,千寻部署可穿戴采集设备,博世开放全球真实场景,双方互为首选数据与设备采购伙伴,共同构建“真实数据—具身模型—真实场景”的高质量闭环。
在核心部件层面,博世提供执行器、传感器等关键零部件,将千寻的“大脑”与博世的“感官与肌肉”深度集成,打通从算法到产品的完整链条。
在全球渠道层面,借助博世遍布全球的产业网络和渠道,千寻智能有望加速进入海外市场——不是作为“中国工业方案”出口,而是作为“全球通用智慧劳动力”的输出。
博世的四大业务板块——汽车与智能交通、工业技术、消费品、能源与建筑技术——全部可以成为具身大脑落地的战场:从家庭服务机器人到商业清洁,从零售交互到楼宇管理,“Bosch × Spirit AI”的联名想象远不止于工业机械臂。
而在资本层面,博世表达成为战略股东意向,意味着在顺为资本、云锋基金等顶级财务资本重仓之后,国际产业资本的接棒入局,为千寻智能的技术路径和商业化路径同时提供了来自产业端的确认。
工业数据锤炼的是模型的鲁棒性与安全底线,而通用智能的内核能力可以迅速迁移至商用、家用等轻工业与服务业场景,形成“一套大脑,多域部署”的生态势能。这一定位的独特之处在于——千寻智能的愿景不是做工业自动化的改进者,而是新一代通用智慧劳动力的定义者。
万亿赛道的信任票
将目光从企业层面拉升至产业全景,博世的入场更显得意味深长。
2026年,具身智能与人形机器人被正式写入“十五五”规划纲要,列入未来产业重点布局。2026年2月,我国首个《人形机器人与具身智能标准体系(2026版)》正式发布,涵盖基础共性、安全伦理等6大板块200余项细则,为企业协同与规模化量产扫清障碍。
市场端的数据同样令人侧目。根据相关测算,2026年全球具身智能市场规模预计突破9200亿元,中国市场规模占比超65%。
在应用端,B端工业制造领域已出现近5亿元的千台级订单落地,实现±0.02mm装配精度与40%的效率提升;C端消费级人形机器人价格已下探至万元级别。技术路线上,端到端VLA大模型已成为行业共识,部分开源模型综合性能超越国际标杆30%。全国已建立超43座人形机器人训练场,累计汇聚近3000万条具身智能数据。
与此同时,具身智能也站上了政策关注的核心位置。2026年被列入六大未来产业、写入“十五五”规划;工业和信息化部人形机器人与具身智能标准化技术委员会成立;各类产业扶持政策密集出台。
在这片千帆竞发的广阔蓝海中,千寻智能与博世的联手,已超越两家企业本身。

回到文章开头的那个问题:千寻智能凭什么?
答案正在越来越清晰。
千寻智能创始人兼CEO韩峰涛曾这样描述2026年——“2026年之于具身智能,就是2023年之于大语言模型,数据和算法开始收敛,模型性能通过Scaling方式快速攀升,真正的‘GPT时刻’正在这一年发生。”
巧的是,博世似乎也这么认为。
韩峰涛在创立千寻智能时已明确一个判断:这场变革的核心技术在于AI,而他的创业愿景也相当直白——缔造新一代智慧劳动力,重塑人机协作边界。30天融资30亿元,资本用真金白银投出了信任票。而博世集团的入场,则意味着国际产业巨头也开始用“技术合作+渠道共享+资本布局”的组合拳,表达同一个判断。
具身智能的全球化时代已来。正如愿景中所描绘的——双方合作指向的不是更有效率的机械臂,而是一个能看见、能理解、能行动、能协作的通用智能体,真正打破人与机器的协作边界。中国具身大模型走向世界的话语权转折,或许就始于这张来自博世的确认函。
