2026年,具身智能被称作“数据元年”,但一个魔幻的现实是:全球高质量的真实物理交互数据总量仅约50万小时,不足大语言模型训练数据的二万分之一。要训练一个能干家务的通用机器人,至少需要千万小时级别的数据。这个巨大的缺口,催生了一个听起来很科幻、干起来很魔幻的职业——数据采集员,说白了就是给机器人当老师。我们的内容组小伙伴达达,今年刚毕业,抱着好奇心去体验了一天的兼职数据采集。他在Boss直聘上投了一圈简历,几乎都拿到了面试机会。面试流程分线上和试岗环节,最让他震惊的是第一轮群面:20多个人在腾讯会议里,HR先问身高体重。原因很简单——采集设备的手套是固定规格的,手太大塞不进去,太小兜不住,太胖太瘦都不行。达达被提醒“可能有点瘦”,但可以试试。2026年最前沿的AI工种,入职第一关居然是量身材。数据采集的具体工作,是穿戴头戴式设备录制第一人称操作视频,记录人如何拿起杯子、叠衣服、施加多大力度、手臂沿什么轨迹运动。这些数据会用于训练具身智能模型,让机器人学习人类操作。与23、24年大模型训练依赖互联网现成数据不同,具身智能需要从零开始采集真实物理世界的交互数据。兼职日结,全职有五险一金甚至六险一金,但要求更高。工作地点不限于一线城市,连达达的老家安庆都有招聘,职位名称可能叫“机器人训练师”。达达试岗后感慨:这份工作比他想象的有意思得多,也离谱得多。他听到的背景五花八门,有刚毕业的文科生,有转行的外卖骑手,还有家庭主妇。所有人都被要求重复做日常动作——比如开冰箱、拿水杯、擦桌子——每个动作要录几十遍,直到设备记录下足够精确的轨迹和力度。这不仅是体力活,更是耐心活。随着具身智能行业爆发,数据采集的需求只会更旺盛。如果你对AI感兴趣但缺乏技术背景,这或许是一个低门槛进入行业的窗口。但也要做好心理准备:这份工作考验的不是学历,而是你能否在重复中保持专注,以及你的手是否刚好能塞进那副手套。
给机器人当老师:AI数据采集员的魔幻日常
AITNT
3小时前
0
2