本刊记者 谢玮
几个月前,具身机器人捡地上的垃圾还是这样的:走到垃圾正前方,停下,弯腰,伸手,捡起。整套动作像被切成好几段,僵硬得一眼就能看出“这不是人”。如今,同样的任务,机器人已经能一边往前走一边自然地俯身伸手,动作一气呵成。
一群“00后”的年轻人参与了这个改进过程。2002年出生的曹宇飞,就是其中一员。
去年10月,曹宇飞正式入职银河通用机器人,成为苏州具身智能数据采集中心的一名数据采集组长。说得通俗一点——他是机器人训练师,手把手教机器人学手艺的那种。
半年多过去,如今他带着二三十名训练师,同时训练着100台具身智能机器人。

曹宇飞在遥操机器人

机器人进行系统而深入的训练
数百小时“喂”出一个动作
要理解这群训练师到底在做什么,得先知道什么叫“遥操”。
遥操不是遥控玩具,是人握着操控臂,手怎么动,机器人的手就跟着怎么动,动作同步、实时跟随。训练师带着机器人完成叠衣服、捡垃圾、夹药盒、上货架等各类动作,全程录制视频。这些数据经质检审核后送入模型端训练,最终让机器人学会自主完成相同任务。
道理不复杂,核心就一句话:没有这种最基础的采集工作,机器人不可能凭空学会干活。
“没有我们进行这些基础的数据采集,机器人就不可能自己做那些智能化的东西。”曹宇飞说。
为了让机器人真正适应更复杂的真实物理世界。在苏州高新区太湖具身智能产业园内,银河通用构建了约20个高度仿真的模拟场景。包括药房、餐厅、酒店等商业服务类场景,卧室、客厅等家庭场景,以及货物分拣、物流、上下料等工业场景——几乎覆盖了机器人将来要“上班”的全部环境。
在这里,100台机器人同时进行系统而深入的训练,实现年采集千万条级高质量多模态数据的目标。
“家庭场景是目前任务种类最丰富的板块。”曹宇飞告诉记者,机器人需要学会叠衣服、晾衣服、捡拾地面物品等日常家务。
采集工作并不是简单的重复。模型端会不定期调整规则,每次调整意味着采集方式的变化。一开始要求比较宽松——把衣服叠完就行。后来规则慢慢细化:领子如果朝下,得先用右手哪根手指把衣服拎起来,看到领子后再用左手去夹,具体夹哪个位置,都有明确要求。“任务是一轮一轮迭代的,越往后要求越精确。”曹宇飞说。
曹宇飞介绍,一般每项任务需要数百小时的有效采集时长来做支撑。训练师每日在岗工作8小时,最终核算有效作业量仅为整体工时中的一部分——而那些操作不规范、不符合标准的数据,会被质检打回来,不计入有效时长。
听上去,训练师好像只是在执行上头的指令,但在实际操作中,事情远没这么简单。
曹宇飞举了个例子。一开始,他们要求训练师按照模型端给的规则来:衣服被机器人爪子抓起后,如果状态是乱的,按方案A处理;如果是平的,按方案B处理。可是实际采集时大家发现,衣服被抓起来后的状态千差万别,“我们就需要自己不断优化,细化到每一种情况该怎么操作”。
商超和酒店场景侧重物品搬运与上架。机器人需要学会从货架上取货、将商品摆放到指定位置,或在酒店场景中完成送物、整理等任务。
医疗场景则要求更高的精准度。
“机器人需要学会夹取药盒、将药品递给患者或放入指定位置。”曹宇飞说,药盒尺寸不一、摆放角度各异,采集时需要覆盖多种情况,模型端对抓取力度和位置的容错空间更小。
从“会做”到“举一反三”
训练师岗位上手门槛不高。
“培训3到5天,有天赋的一两天甚至一天就能达标。基本上成年人都可以做。”曹宇飞告诉记者,一个过去没有的岗位,如今让不少年轻人,甚至转行过来的中年人,找到了新的职业起点。
设备维护也是日常的一部分。机器人夹爪因发生碰撞,导致硬件受损,需要现场运维工程师解决。曹宇飞说自己未来想多学一些硬件知识,“多懂一点总归是好的”。
他偶尔会想想3年、5年后的事。
“刚开始要求机器人能成功做成一件事。往后可能需要数据的多样性——同一个任务,不同物品、不同款式、不同环境,都需要泛化。”他举了个例子:现在训练机器人从地上捡手机,可能只用一款手机反复采集。未来则需要不同品牌、不同尺寸的手机都采一遍,让机器人真正“认识”手机这个品类,而不只是记住某一款的样子,“机器人要从完成一个任务,到更好地完成,再到举一反三”。
曹宇飞说,他的家人、同学有时在酒店看到机器人送外卖,会拍照发给他。他会回一句:“这些东西跟我们干的也是有关系的。”
这个年轻人语气里带着一种朴素的自信——机器人越来越聪明这件事,有他的一份功劳在里面。
