尽管VLA模型在过去两年主导了机器人“大脑”的构建逻辑,但英伟达范麟熙、宇树科技王兴兴等领军人物已公开表达担忧。他们认为,真实世界数据的匮乏、模型泛化能力的瓶颈以及系统稳定性不足,是纯VLA路线难以逾越的现实鸿沟。
在技术路线尚未完全收敛的当下,产业界亟需寻找一条能够兼顾理论突破与工程落地的务实路径。
备受关注的具身智能企业星源智即将发布全球速度最快的“具身交互世界模型”,赋予机器人主动推演物理世界变化的能力。6月3日,星源智宣布完成新一轮融资,累计金额达10亿元人民币。投资阵容豪华,涵盖松禾资本、创东方、华控基金等财务机构,中车资本、北工投资、国君创新投、江西金控等国资本体,以及埃泰克、恒兴集团等产业方,老股东元生创投连续三轮追加,成立仅10个月便展现出强劲的资本号召力。
背靠曾孵化出智谱AI的北京智源研究院,星源智凭借在“世界模型”上的原创性突破,立志成为具身智能领域的下一个独角兽。本轮融资将专项用于下一代具身大脑研发、规模化量产落地及顶尖人才引进,构建技术护城河。
重构认知架构
具身智能的规模化落地始终受制于两大核心痛点:真实物理数据获取成本极高,难以支撑复杂长程任务的泛化训练;大模型对算力与功耗的严苛要求,使得在机器人本体上的稳定部署成为巨大挑战。
针对上述难题,星源智并未盲目追求参数规模,而是确立了“软硬一体、端侧部署”的差异化技术战略。
其核心在于构建“具身大小脑”协同架构。“大脑”主导语言理解、环境感知与长程推理,具备反思重规划能力;“小脑”则聚焦导航与操作等运动控制,负责将高层决策转化为精准执行。
这种分层设计与国际头部企业PI、Figure AI的“快慢系统”理念异曲同工,但星源智更强调全模型端侧部署与自研算力平台,从而摆脱云端依赖,在真实场景中实现更低时延、更高稳定性的运行。
如果说“大小脑”解决了“如何行动”的问题,那么世界模型则致力于回答“行动后果如何”这一更深层的命题。
不同于传统世界模型依赖视频生成来预测画面,星源智认为,对于具身智能而言,核心在于理解“动作对世界状态的改变”。
基于此,星源智构建了具身交互世界模型,通过学习“当前状态—动作—未来状态”的动态映射关系,在潜空间中捕捉物体交互与状态变化,进而指导动作生成与修正。
这意味着机器人具备了主动推演物理世界的能力。在执行抓取或移动任务前,它会在内部进行“模拟演练”:预判环境变化、评估失败风险并优化执行方案。
该模型的核心价值在于推动机器人从“看见世界”向“理解交互”跃迁,从“执行动作”向“预判后果”升级。作为连接感知、决策与控制的中枢,它能以更低的数据成本和更高的推理效率,适配复杂多变的开放环境。
打造物理AI标杆
继大语言模型之后,世界模型已成为具身智能领域的关键竞争高地。其价值在于帮助机器人建立对物理规律的底层认知,从而降低对海量真机数据的依赖,大幅提升跨场景泛化能力。
区别于单纯的工程落地团队,星源智兼具深厚的科研底蕴与丰富的产业化经验,展现出独特的技术-商业双重优势。
公司汇聚了来自清华、北大、慕尼黑工大及智源研究院的顶尖复合型团队,长期深耕世界模型、强化学习与具身智能前沿领域。
核心团队早在2024年便提出了与JEPA相近的技术思路,相关研究早于LeWorldModel等方案,部分理念已逐渐演变为行业的重要技术范式。
刘东表示,公司坚持“技术深耕”与“量产落地”双轮驱动,致力于成为全球领先的具身大脑与世界模型供应商。
成立不到一年,星源智的商业化进程显著加速,市场验证初见成效。
其软硬一体化解决方案已深度服务头部本体厂商,覆盖超70%的头部具身智能企业,并成为英伟达Jetson Thor平台全球最大的出货合作伙伴之一,生态位优势明显。
在场景落地方面,星源智与北京亦庄机器人公司合作推进政务、巡检及导览导购应用;同时与头部能源、电力集团协同,在高价值的电力巡检与设施运维场景实现规模化部署。
随着融资落地,北京智源研究院将持续支持星源智,双方共建“具身交互世界模型实验室”,通过人才与资源互补,加速前沿技术的成果转化。
作为智源研究院在具身时代的重点孵化项目,星源智正朝着成为下一个“智谱”的目标稳步迈进。
投资机构观点摘要:
松禾资本指出,具身智能是AI落地物理世界的终极载体,而“世界模型”是突破通用具身智能的关键。星源智团队兼具前瞻视角与工程落地能力,其“软硬协同、端侧部署”战略定力将使其成为产业发展的关键变量。
中车转型升级基金认为,星源智的技术方案打破了传统工业机器人的规则局限,其算法的泛化性与环境适应性在轨道交通与新能源装备领域展现出巨大的变革潜力,将助力相关产业的数字化升级。