一天标200万个点,来看数据标注师的“科幻”工作

 



看起来像个大网吧,上百人坐在一排排电脑前,有的屏幕旁还开着风扇,放着零食。

滑动鼠标,屏幕上深色背景中的三维图像不断翻转变幻,乍一看,就像游戏界面,炫酷无比。
这里是百度(山西)人工智能基础数据产业基地,这些年轻人都是“AI数据标注师”,他们有的在为自动驾驶汽车标注车道线、红绿灯,有的在为肺部影像标注病毒数据。

人工智能行业有句话:有多少智能,背后就有多少人工。数据标注师就是人工智能背后的“人”,也是人工智能领域的“入门”工种。今年2月,这项职业正式被纳入国家职业分类目录。

拥有近4年从业经历的“90后”李宇龙,已经是一名资深的数据标注师。过去,他在一家印制电路板的外资企业工作,整天面对的是生产线。2017年合同到期后,他回到老家,机缘巧合下,接触到了百度智能云众包,从此开始坐在空调房里“玩”电脑,教AI认识数据。
李宇龙最近正在做一个自动驾驶的数据标注项目。在此之前,他从未想到,自动驾驶汽车眼中的世界就是一幅幅不断变幻的点云图。他要做的是,对照摄像头拍摄的照片,赋予这些点云图以准确的含义。

“你看,把汽车框起来,都打成白色的点,就代表这是一个障碍物。”随着李宇龙鼠标的快速滑动,屏幕上的点云图不断翻转,一个个针尖大的数据点被标注在图中不同物体上——蓝色是路面、绿色是绿植、红色是路沿、白色是障碍物。
“一张普通的点云图,大约要标注18万个点,一个熟练的数据标注师半个多小时就能完成。这样算下来,一天标200万个点不成问题。”李宇龙说,数据标注的工作是“按件取酬”,他的日均收入在300元左右。“这水平在整个基地处于中等,据我了解,有人日均收入甚至能破千(元)。”

李宇龙说,现在数据标注的内容已经从图片拓展到语音,图片里除了自动驾驶,还有医疗CT、人脸等,语音既有普通话、各地方言,还包括外语,对数据标注师的要求也越来越高。

通过每天数千次的重复动作,李宇龙和无人驾驶、人脸支付、智能家居、智慧医疗等前沿科技产生了紧密的联系,这让他有一种“科幻感”。

目前,AI数据标注师的技术门槛并不高,只要能熟练操作电脑,经过一定的培训就能上岗,招工人群较为广泛。以百度(山西)人工智能基础数据产业基地为例,现在这里有2300多名数据标注师,今后5年预计将为5万名数据标注师提供就业岗位。

尽管每天对着电脑有些枯燥,但数据标注职业为李宇龙打开了更大的世界。“因为经常接触不同的项目,每个项目涉及的领域不同,比如有教育、安防、金融、交通、医疗和电商等,经常会带来新鲜感。”

AI数据标注师是一个充满可能性的新职业。随着人工智能的快速发展,简单的数据标注将逐步被机器取代。数据标注师的未来,或许会向数据治理、数据解决方案设计和项目管理等方向发展。

现在,李宇龙的工作重心已经转向培训和项目管理。在他看来,自己比很多传统行业的人更早地接触到未来的生活和工作场景。

“看到了未来的方向,就能比别人更早地找到发展机会。”他说。

策划:张旭东
监制:雷敏
记者:马晓媛、马志异、梁晓飞
视觉/编辑:唐兴


    关注 新华视点


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册