快递员保洁员理货员……京东发动60万人为具身智能采集数据

京东发动超过60万人采集数据,推动具身智能发展,关键在于解决数据需求与采集难题。 1. 数据需求分为三层:互联网视频数据、特定场景人类第一视角实操数据、机器人本体运行数据,数据量自下而上递减,但采集难度递增。 2. 采集瓶颈包括数据不足、杂乱非标准化、难以训练和合规流通,京东通过全链路基础设施提供解决方案,如JoyEgoCam设备让员工边工作边采集。 采集规模与细节表明其可行性。 1. 计划首年完成500万小时人类活动视频采集,两年内突破1000万小时,目标成为全球最大数据服务商。 2. JoyEgoCam设备配备4K高清摄像头、130度广角等,重仅220克,便于在物流、医疗等场景使用。 处理效率高、成果显著。 1. 数据经AI数据湖清洗转换,使用JoyBuilder仿真平台泛化扩增,模型训练效率提升3.5倍,成本降低60%,数据有效率达95%。 2. 京东具身大模型JoyAI-RA真机实验成功率73.5%,上线数据交易平台支持合规流通,首批开放2000小时数据集。
具身智能要实现从实验室研发到规模化落地的跨越,核心在于解决高质量数据的供给瓶颈。当前行业面临数据杂乱非标、交互性不足以及数据孤岛等挑战,且标注与训练环节割裂。具身智能所需的数据呈金字塔结构:底层为互联网第一视角开放数据,中层为特定场景下的实操作业数据,顶层则是机器人本体运行数据。随着层级上升,数据采集难度与成本剧增,这要求行业必须构建从源头到应用的全链路基础设施,将原始数据精炼为驱动模型进化的高价值“燃料”。

针对这一行业痛点,京东推出了全链路具身智能数据基础设施,旨在打通数据采集到模型测试的闭环。在采集端,京东云自研的可穿戴式超高清采集终端JoyEgoCam,支持在物流、零售、医疗等多种场景下“即戴即采”。该设备整机仅重220克,佩戴舒适,却集成了4K高清摄像头与130度超广角镜头,支持60帧帧率拍摄,能够实现毫秒级的动作细节捕捉。

在精准度与稳定性方面,JoyEgoCam内置车规级6轴IMU与多传感器融合单元,即使在极端抖动场景下也能稳定追踪拍摄。搭配京东云自研立体校正技术,其重投影误差小于0.2像素,能够真实还原操作现场的空间立体感。这种高精度的采集能力,确保了快递员、保洁员等一线人员在作业过程中即可完成专业级数据采集。

依托其丰富的业务场景,京东发动内部超过10万名职业员工及外部最多50万各行业人员参与数据采集,仅在宿迁一地就将发动超10万市民。这一行动覆盖了家庭、工厂、物流、医疗等超百个细分场景,堪称“人类历史上规模最大的数据采集行动”。根据规划,京东将在首年完成500万小时人类活动视频数据采集,两年内突破1000万小时,同时积累100万小时机器人本体运行数据。

数据经采集后,通过SaaS化部署实现一键上云,汇入AI数据湖平台自动完成清洗、对齐、转换与预标注。JoyBuilder仿真平台能够批量生成高逼真仿真数据,实现人类操作数据向仿真操作数据及真机操作数据的高效增值转换与泛化扩增。治理后的数据汇聚至JoyBuilder模型开发平台,支持数据“开箱即训”、模型“一键部署”,大幅降低VLA大模型研发门槛。

得益于自研AI算子矩阵贯穿去畸变、语义描述等关键环节,京东的数据处理效率显著提升:模型训练效率提升3.5倍,整体处理成本降低60%,数据有效率高达95%。目前,京东日处理数据量已达数十万条。基于此全链路闭环训练出的京东具身大模型JoyAI-RA,在真机实验上成功率达到73.5%,性能超过pi0.5等SOTA模型。

此外,京东上线了具身智能数据交易平台,首批定向开放2000小时高精标注数据集,打通了数据合规交易通道。该平台支持数据方、开发者、应用方多方协同,汇聚了京东丰富业务场景下的多模态数据资源。通过构建“硬件采集-数据处理-模型训练-仿真测试-合规交易-生态共建”的完整产业链条,京东正形成“具身智能超级供应链”,推动行业商业化进程。

【价美丽平台】致力于为淘宝、京东、拼多多等商家提供推广服务,助力店铺实现快速起店、精准测品,高效解决店铺运营难题,加速店铺成长,轻松打开市场!