
做数采的年轻人
在北京五道口的一栋大楼里,全副武装的张磊(化名)正参加机器人采集数据的试岗培训,将桌上羽毛球放进球筒。他头戴有两个摄像头的黑色头盔,手腕绑摄像机,腰缠数据线,手套布满传感器。他得用慢动作且无多余动作,手不出汗,因手套价值5万元,损坏赔不起。
大学毕业两年,这是张磊第四份数采工作。前三份是真机遥操,第四份公司用自研可穿戴设备采集数据。过去两三年具身智能升温,但缺数据成瓶颈,觅蜂科技姚卯青称具身智能模型达类人初步能力需一亿小时量级数据,而全球有效数据仅约几十万小时。
张磊2024年开始数采,此前卖房,经亲戚介绍转行。那年国内人形机器人创业热,融资56起,超50亿元。他第一份工作在小初创企业,后辗转千寻、松灵。他热衷加班夜班,月入最多9000多元,想赚快钱攒钱买房。他不愁被机器人取代,愁工作枯燥。
00后李子豪是大型数采场实习采集员,即将从河北二本师范院校人工智能专业毕业。高考本想报土木工程,经老师建议读人工智能。毕业后同学就业不一,他采集机器人夹三明治数据,工作重复。
大型数采场的科幻与现实
张磊入行时,数采是机器人公司自己的事,小规模、自用型。到李子豪入行,数采成基础设施生意,走向大型数采场。2025年以来,各地政府和国资支持建设,全国至少15座,京津冀等地均有。
大型数采场占地3000 - 5000平方米,有些达上万平方米,部署上百台机器人。北京人形机器人创新中心具身智能机器人数据采集与训练基地是全国领先数采场,一年产能最高达十几万小时,数据按小时或条数出售,客户是头部企业和大模型公司。
这类数采场创造新岗位,但部分不高效。投入超亿元,未盈利,设备和软件问题多,数据生产链条原始。
走出数采场
此前多采用有机器人本体的数据采集方式。2024年前后,学术界探索UMI、Ego等无本体采集方式,2025年下半年产业界升温。张磊最新工作属无本体采集,见证技术路线变迁。
过去VLA模型依赖真机数据,产能有限。英伟达范麟熙提出用WAM取代VLA,用UMI和Ego数据取代真机数据,但无本体采集短期内难完全替代真机遥操。
一副手套背后的新生意
2025年,90后林成志接美国公司需求生产穿戴式数采设备。他此前在大疆等工作,后自主创业。完成委托后自己做数采业务,用数据手套和有深度图功能的头显。
张磊试岗公司的设备融合多种技术,两副手套近10万元,设备不成熟。行业头部公司和资本入场,觅蜂科技推出设备并融资。灏存科技创始人熊鹏航称2026年一季度订单增多。
如何让更多人接纳新型数采
林成志组织工厂采集数据,给工人设备和补贴,但工厂配合不易。他还鼓励工人居家采集。觅蜂科技采用加盟方式,京东发动大规模数据采集行动。
劳务中介变得重要,能对接工厂资源。张磊试岗培训的数采员由中介招募,中介抽成。Tina发现数据采集市场大,想与觅蜂科技合作。
被机器人采集的人
数据采集全民化,招聘多是兼职或临时工。但完成任务拿报酬不易,有诸多要求。面试注重身体细节,培训也有要求,有人中途退出。
数采员采集数据卖给机器人公司,赚取日薪。数据采集全民化带来隐私、权属等新问题。在机器人走进生活前,人类要为其提供数据。
760

被折叠的 条评论
为什么被折叠?



