日薪120元 全民数采 谁在训练下一个机器人保姆?

总:本文介绍了当前具身智能行业兴起的全民数据采集新零工,普通人可参与获得收入,核心干货如下 1. 工作内容与门槛:该工作是让普通人用拍摄设备记录自己做家务、户外运动等日常动作,采集的数据用来训练机器人做家务等技能,门槛极低,仅需要参加半天培训学会使用软件和拍摄要求就能上岗。 2. 薪资与参与要求:工作可居家完成,日薪大概100-120元,要求每天拍摄不少于8小时,需要保证手部动作完整,在不同场景、不同条件下完成不同任务,不能反复拍摄同一内容。 3. 参与条件:目前最新模式仅需要一部手机加一个50元左右的挂脖支架(多数情况由招聘方报销),就能参与,招聘信息大多发布在各类兼职群中,适合空余时间较多的普通人参与。
技术转向:从模仿动作到理解世界

具身智能行业的底层逻辑正在经历一场深刻的范式转移。过去主流的VLA(视觉-语言-动作)模型路径,要求采集员像机器人一样精准操作,因为模型需要通过高精度的遥操作数据学习“照葫芦画瓢”。然而,随着世界模型(WAM)路线的崛起,技术重心已从模仿动作转向理解物理世界的因果规律。这意味着,数据采集的标准发生了根本性逆转:行业不再苛求毫米级的关节角度精度,转而追求海量、多样、真实的日常操作场景。哪怕动作不够标准、环境杂乱无章,只要能反映重力、褶皱、力矩等物理常识,就是高价值数据。这种从“精准示范”到“正常记录”的转变,直接解构了数据采集的准入门槛。

数据缺口:千万小时级的刚需

技术路线的更迭,进一步放大了本就严峻的数据饥渴。行业共识认为,训练具备泛化能力的具身大模型至少需要1000万小时的数据,而实现真正的智能涌现则需要100亿小时。相比之下,目前市场可采购的数据集仅有几十万小时,供需严重失衡。在场景分布上,家庭场景以80%的占比占据绝对主导,商超和工厂分别占20%和10%。数据配比正呈现出“90% Ego数据+10%真机数据”甚至“99% Ego数据+1%真机数据”的极端结构,这意味着谁能以百万乃至千万小时的规模持续供给高质量的第一人称视角(Ego)数据,谁就掌握了模型突破的主动权。

设备迭代:降低门槛的供应链革命

为了应对海量数据需求,采集设备经历了从“真机遥操”到UM(通用操作接口),再到“第一人称人类视频(Ego Centric)”的三次迭代。每一次迭代都伴随着成本的断崖式下跌和参与者的爆发式增长。英伟达的EgoScale框架验证了仅需2万小时人类视频加少量真机数据即可训练模型;京东云推出了自研可穿戴终端JoyEgoCam,计划两年内采集超1000万小时数据;蚂蚁数科则研发了成本低于20美元的颈挂支架方案。甚至有厂商推出了售价千元的AI眼镜,鼓励用户通过录制家务赚取收益。这种从专业设备到民用手机的普及,使得数据采集从实验室走向了大众生活。

众包落地:数字零工的真实图景

2026年3月起,无本体数据采集以众包形式全面爆发。河北人张月是这股浪潮中的典型样本,她通过佩戴头环和夹爪录制叠衣服、浇花等视频,日薪约120元。随着技术路线向纯视频采集转移,设备进一步简化为手机加支架,采集门槛大幅降低。然而,这也是一份充满挑战的数字零工:虽然名义时薪从3月的50元降至近期的20-22元,但由于有效时长往往不足录制时长的25%,实际收益并不稳定。采集员需要在不同光线、场景下反复操作,且面临动作遮挡、隐私脱敏等严格审核,这使得高强度的劳动与并不稳定的产出形成了鲜明对比。

商业博弈:高毛利与全球竞赛

尽管众包模式面临质量控制和人员流失的挑战,但这依然是一门极具吸引力的生意。综合众包薪酬、培训及处理成本,总成本约100元/小时,而对外售价可达200元,毛利接近100%。在资本与全球竞赛的双重驱动下,行业已进入白热化阶段。美国有DoorDash动员配送员录制视频,印度有服装厂工人参与采集,国内京东、觅蜂科技、百度等巨头也纷纷建立数据交易平台,试图统一标准并解决供需匹配。这场关于物理世界的数据军备竞赛,正在倒逼行业加速,所有人都在等待具身智能“GPT时刻”的降临。

【价美丽平台】致力于为淘宝、京东、拼多多等商家提供推广服务,助力店铺实现快速起店、精准测品,高效解决店铺运营难题,加速店铺成长,轻松打开市场!