摄影 | Chin Chen 编辑 | 米杜 董淑云 新浪图片出品 2018-04-12
人工智能背后的人工
文/Chin Chen
“嗒嗒嗒”的鼠标敲击声在偌大的办公室里交汇着,一个眼圈发红的女孩眼睛牢牢地盯住电脑屏幕,她所需要做的是把图片中放置在冰箱的饮料名称和类别一一对应起来。
面对不太常见的饮料,她在右下角的菜单栏里不停地翻阅着“碳酸饮料、乳制品、凉茶”等类别。一轮过后,还是没能找到这瓶饮料的名称。她开始有点焦急,抬起头来看了看周围的人,然后又埋头在茫茫大海中“捕捞”着。
不久后,她分类标注出来的这些数据将用于智能冰箱的物体识别。
近几年,随着AlphaGo击败人类顶尖围棋选手李世石、柯洁等一系列事件,人工智能开始逐渐走红。而人工智能需要大量的数据来供机器深度学习,这些数据正是出自这群隐形者手中,他们是“人工智能背后的人工“。
贫困山区里的大数据“硅谷”
在过去数年,大数据、人工智能逐步走进社会成为公众话题。而位于西南贫困山区的贵阳,从2014年开始扛起了大数据战略的大旗,致力成为中国大数据的“硅谷”。
从贵阳市区沿着刚修好的公路驾车50多公里,就到了百鸟河数字小镇上,道路两边的松树站得齐刷刷的,一列又一列。小镇四面环山,人迹罕至,去年因举办了人工智能服务论坛逐渐被外人所知。
在这里,有着一个能容纳400多人的数据工场,电脑前坐满了来自附近一家扶贫高职的学生,他们流程化地框图或处理语音,这些大量标注好的数据将用于“人脸识别、无人驾驶、语音识别”等高科技项目。
在1000多平方的标注服务部里,学生们被划分成不同的小组:有的负责把道路上的汽车、行人、红绿灯等框起来,用于自动驾驶的训练;有的负责把每一段语音记录下来,用于语音识别;有的负责把视频抽出几帧,用于机器对运动物体的识别。
“数据标得再好,还是没有前途”
小纯是扶贫高职的一名学生,这个寒假,她并没有像以往一样早早回家。临近期末的一节宣讲课上,小纯第一次听到了“人工智能”这个词便被吸引住了,她毫不犹豫地报名参加了数据工场的实习。
小纯每天从学校来到办公室的第一件事便是打开电脑,登录众包平台,那里有着2000多个图片拉框任务等着她完成。
数据标注作为一个劳动密集型行业,门槛并不高。经过几天的培训,小纯很快就上手了。框图要求十分精细,每一个物体边缘都需要放大对准,小纯每天从早上九点框到晚上八点,这时常让她的眼睛感到疲劳。
小纯的桌上摆着一盆万年青,旁边的苹果已经开始腐烂。小纯坐在电脑旁,翘着腿,时不时抖动一下,目光没离开过屏幕。邻座的胖子对她说话的时候,她还是一动不动地保持姿势回答,不想让说话影响了自己的进度。
小纯电脑屏幕上的道路指示牌上写着“北六环”,这显然是一条北京郊区的高速公路。她右手拖动鼠标,为道路图片中的车辆和行人打上边框,并标注行进方向和是否有遮挡,连续框了十几张完全一样的道路图片后,她看起来有些无聊。
时常待在山区里,小纯对被自己框住的汽车一概不了解。一边是一线大城市的自动驾驶研发,一边是贫困山区中坐在电脑前框图的高职学生,小纯和同学们源源不断地为北上广深的人工智能公司提供数据,但他们之间存在着被忽视的数据折叠。
“SUV到底长什么样?无人驾驶是不是真的安全?以后还要不要考驾照?”小纯好奇地问着。她经常会把答案寄托于我这个外来者身上,时不时回过头来对我使着眼色。
小纯每天上班七八个小时,一个月能挣两千元,她很珍惜这个相对体面的挣钱机会。二十天的工期里,还不太熟手的她拿到了800元。腊月二十七,小纯第一时间给奶奶买了她最喜欢的猕猴桃,转了两趟车,回到了位于偏远山区的家乡。
然而这个春节对小纯来说是残酷的,糟糕的事一桩接着一桩:腊月二十九,身体一直不错的奶奶因为一场突如其来的大病,卧床不起,几天不吃不喝;父母俩人常年分居两地打工,年前办理了离婚手续;哥哥不满父亲带后妈回家过年的举动,和父亲大吵一架后,离家出走;而她,只能一个人扛起了全家的担子。
从家里回到公司,小纯的状态一直很压抑,不仅烦恼没人能倾诉,连数据标注的质量也出现了下降。周边不断有朋友问她:“为什么还留在数据工场?每天就坐那里框啊框的,学不到任何东西,眼还容易花掉。”渐渐地,她对自己的未来前途也开始感到迷茫。
“周边的同学说,即使数据标得再好,还是没有前途。”小纯一直梦想着,有朝一日能够通过自己的努力,走出这座大山。
未来的机器人会不会取代我们
与小纯渴望走出去的梦想不同,标注组长小广希望毕业后能继续留在这里打拼。
小广是数据工场的元老级员工,见证了工场从几十人增至几百人的历程。2015年10月,他先是加入了扶贫高职的电子商务俱乐部,做跨境电商的产品分类。面对密密麻麻的字母,英文基础不好的他做得很吃力,常常借助翻译工具理解。三个月后,大数据工场成立,他随着实践团队移到数据标注部。
在做了一段时间的标注员后,经理欣赏小广踏实和勤奋的工作态度,并举荐他和另一个同学去竞争标注组长的岗位。然而爷爷突然因病去世的消息在午后的一个电话传到他这里,很长一段时间,小广都待在家里没回去上班。
调整好自己后,小广决定回到公司,原以为当标注组长的机会没了,但经理还是相信他的能力,让他试着带十来个同学做项目。在数据工场的一年零一个月,他从标注员升到了标注组长。
“加入数据标注公司最大的改变是性格。”自懂事以来,小广的父母就外出打工,把自己一个人放在外婆家生活。每当遇到烦恼,小广就躲在房里,也不知道怎么和外婆诉说,慢慢地变得有点自闭。来到这里,小广开始和同学、老师有了更多的交流,开始谈了第一次恋爱。
现在,小广手下管着十几个同学,他的主要工作是检查、指导组员的标注质量,并向主管汇报标注进度。如今,小广处理起来已经得心应手。
然而,数据标注的市场才刚打开,公司的运营也遭遇了寒冬。在前一两个月,数据工场处于过渡期,大多时间用于培训和锻炼学生,仅有少数项目产量化为盈利,学生的工资也往后拖延。“那时候项目不稳定,收入也时多时少,以补贴的形式,一般我能拿到五六百。” 小广说。
此后,每天都有同学抗议。在新调来的经理在与小广、其他同学持续的长谈之后,这场危机总算是化解,工场也渐渐步入正轨。现在项目产量多的时候,小广一个月能赚五千多块。最近,他给远在浙江打工的妈妈买了一部价值1300元的手机。
随着人工智能深入更多垂直行业,需要的数据数量也持续增加。数据工场现有的400多人已经不能够满足甲方的要求。在紧邻工场的地方,他们又租下了一幢三层高的大楼,待装修好继续扩招标注员工。
在那里,小广看到了公司的招牌被换成了数据工厂,他以为公司搞错了:“怎么变成了工厂呢,不应该是操场的‘场’吗?”同学继续低头看着手机,用着很坚定的语气回答小广:“这本来就是工厂啊,四百多人,大量生产的工厂。”
现在距离毕业的时间仅有三个月,小广希望自己能留下来。“用通俗一点的话说,就是赚多点钱,养活自己和家人。”小广笑笑说。同时,小广和他的同学也在担心着,他们教会了机器人学习工作,而未来的机器人会不会取代他们的工作。 |