寻亲记:百度AI的人间情怀

 

技术是冰冷的,也是火热的,它有着丰富的人间情怀。一旦人工智能拨开应用迷雾,与具体社会碰撞后,会生发无穷的力量。...

导读:技术是冰冷的,也是火热的,它有着丰富的人间情怀。一旦人工智能拨开应用迷雾,与具体社会碰撞后,会生发无穷的力量。

技术是冰冷的,也是火热的。

“当技术找对了用途,是有温度的。”一位百度员工,在见证了一个分离27年的家庭视频上的感人重逢后,感慨地说。

视频这一头,是一位33岁的福建男子。不,他的老家是四川石柱县。27年前,他6岁时,被人拐卖到了福建。



(付贵的父亲与他视频中)
(病床上的付贵)
他叫付贵。但这不是他现在的名字。他甚至已经忘记了儿时的大名。8年前,他去宝贝回家网上登记寻亲时,留下的名字是“胡奎”。

实在是太久了。

视频那一头,是他的奶奶、爸爸、姑姑。他们三个人都难以控制自己的情绪。奶奶患了肺癌,最大的心愿是,有生之年见到孙子一面;爸爸内向木讷,但多年来,一直托人在网上发寻亲启事,也一直对着小儿子念叨“付贵”,一定要让小儿子记住,自己有这样一位哥哥。

至于姑姑,她的感情可能最复杂。因为,付贵就是在她手里走丢的。27年前,她送付贵上幼儿园后,就再也没见过这位自己一手带大的侄子。为此,她背上了沉重的感情包袱。

“付贵啊,你还认识我吗?知道我是谁吗?我是你姑姑啊,我没有一刻不想你啊!”姑姑泣不成声。

视频这头的付贵,相对克制。作为被丢失的孩子,他可能体会不到丢失孩子的亲人的痛苦。

(姑姑喜极而泣地买水果)
时间太久了。付贵向宝贝回家网站提供的个人姓名、出生日期、失踪日期、失踪地点都是错的。他在四川失踪,他报的失踪地点,却是自己被拐来的福建。

不能责怪一个人残留着的6岁时期的记忆。只是,这给宝贝回家志愿者协会的工作人员造成了很大困扰。后者总部位于吉林通化,是一家在民政部门正式注册的公益寻亲机构。它既有一支庞大的志愿者队伍,又与多地公安和民政部门有着合作关系,还拥有民政部走失人员平台和公安部打拐办DNA库的运营权,可以说是目前国内最权威的一家寻人平台。截至目前,这个平台已帮助1870人找到自己当年的亲人。

但这样一家权威平台,只能依靠人工判读亲子双方提交的信息,尤其照片等历史资料,工作繁杂,像是迷宫。不要说许多模糊的比对,就算是高度匹配的信息,也无法直接判定,只能提请DNA鉴定。而DNA鉴定成本高昂,且手续十分严肃,只有在极有把握的情况下,才会将它作为最终的确认手段。

付贵提交的资料和付贵亲人提交的资料相差太远了。按照宝贝回家的既有工作方式,两者很有可能被判读为不匹配。如果双方的DNA尚未预先入库,那希望就更渺茫了。

事情的转机,发生在今年央视《等着我》节目上:百度AI平台部经理闫旭、百度战略合作部、企业社会责任部的负责人,和宝贝回家创始人张宝艳充分沟通后,当场确定了一项合作。

之前和之后,还有两件事值得注意。一是今年1月,百度机器人“小度”参加了《最强大脑》,并且在人脸识别项目中战胜了“世界记忆之王”Alex。当时,刚当上母亲的章子怡在现场提议:“我们有很多走失儿童,长大后,亲生父母都认不出来,但是小度可以帮我们辨别。”



另外就是政协委员李彦宏今年“两会”的两会提案:《关于利用人工智能和大数据技术,帮助解决走失儿童问题的提案》。

李彦宏建议国务院办公厅牵头,协调公安部、民政部等单位,建立适用于搜寻走失儿童的人脸识别模型;建立覆盖全国的走失儿童数据库;将人脸识别技术与治安、交通监控系统相结合等等。

这三件事背后都与人脸识别技术有关。而且,它们都和打拐寻亲发生了直接联系。而百度,正是其中的技术平台。

需要绕开几句。长久以来,百度给人两张面孔。大致2012年以前,它偏重技术,在全球树立了中国互联网业的地位。一个段子很形象,就是创业项目挖人,会挖百度的工程师、阿里的运营人马、腾讯的产品经理。百度能成为中国互联网一极,绝非偶然。

但2012年后,百度在商业变现方面加速,导致面孔有些模糊。直到去年,一些流量过度变现促成危机。

而2106年下半年以来,李彦宏主导了百度的变革,不惜抛弃许多业务,直接弱化部分营收与利润,而强力重塑品牌形象,最终确立了人工智能的未来愿景。一个充满活力的百度,再度回归到全球科技产业前台。

不过,由于人工智能大幕初启,尽管百度在图像识别、语音识别、计算、算法等许多领域走在世界前沿,但因许多应用场景需要不断丰富,因此,外界对此充满质疑。

2016年,甚至有人照着谷歌骂百度,说它没有责任感,搞技术不过花腔罢了。而实际上,很多人没有看到,百度为此投下的巨资,仅仅人工智能团队就有1300人之多,而且其中拥有许多全球顶级的人工智能转架。

前几天,深圳IT领袖峰会上,当主持人吴鹰表扬腾讯人工智能围棋项目绝艺时,马化腾坦陈,李彦宏主导的百度人工智能,更先进,已占据先机。确实如此,早在2013年年初,百度就成立了深度学习研究院,2016年上半年明确将人工智能确立为未来愿景。可以这么说,百度是全球范围最早明确做出表态并身体力行的一个。



以人脸识别为例。百度早在2012年就开始在人脸识别上发力,推出了国内第一款全网人脸搜索引擎。而此前在人脸识别技术两个最权威的国际评测FDDB与LFW中,百度都拔得头筹,在LFW中还获得了99.77%的准确率。

另外值得注意的是,百度人脸测试集的数据库已包含两百万人的两亿张图片。

人类大脑从上百万年前开始就拥有了人脸识别的能力,而机器没有直觉,也并没有久远的进化历史,只能靠分析数据来学习。计算机只认识0和1,所以它必须通过无数次的学习来找到人类直觉的规律并将它转变成0和1存储在脑子里,从而模拟人类通过直觉思考的过程。

人脸识别技术研究的困难,不同于普通的图像识别。就人的脸部特征而言,每个人的脸部结构都是相似的,这对于利用人脸区分人类个体不利,还有一些特殊情况,比如双胞胎甚至多胞胎。其次就是表情、光照条件、整容等外因影响。不同的表情、角度观察,光照条件的影响,人脸遮盖物,如口罩、墨镜、头发、胡须,甚至是整容、P图等行为,都增加了人脸识别的难度。

跨年龄人员识别更是个难点。在跨年龄阶段人脸识别中,类内变化通常会大于类间变化,这造成了人脸识别的巨大困难。同时,跨年龄的训练数据难以收集。没有足够多的数据,基于深度学习的神经网络很难学习到跨年龄的类内和类间变化。

百度团队想了个办法,叫做度量学习:通过学习一个非线性投影函数,把图像空间投影到特征空间中。在这个特征空间里,跨年龄的同一个人的两张人脸的距离会比不同人的相似年龄的两张人脸的距离要小。

说通俗点,就是把单纯由年龄造成的人脸差异加以调整,让其相对于其他差异显得更小一些,这样才容易识别不同年龄的同一个人。

让我们回到百度与宝贝回家的项目上来。

在《等着我》节目敲定合作意向后,百度抽调IDL(深度学习实验室)、 AIP(AI平台部)、AIQA(AI测试部)、众测(平台测试部)等多个部门的十几名员工,成立了“AI寻人”虚拟团队,在从宝贝回家获取了数据后,3月9号开始比对。

这比上节目难多了。

首先是数据量。第一批照片超过2万张。此外,很多照片不规范。如过度PS、人物过多、比对年龄区间较大等等。

怎么办?纯靠人力完全不现实。百度团队利用出生日期和失踪地点等变量,进行了一定约束,在更小范围内进行比对,以提高效率。如此,每天大概能比对几千张。



第一批匹配得分较高的照片出来,有数十组。其中两组得分明显偏高,付贵就在这两组里面。

“我们第一眼看到百度团队提供过来的付贵资料,就觉得这个应该是了!除了照片像之外,还有一个是名字,’付贵’与‘胡奎’的发音很近。”宝贝回家工作人员进一步核实了信息后,开始联系双方进行DNA的入库比对。

但是,说起来简单。接下来的事情之繁重,还是超过了百度团队的想象:核对当事人信息、联系父母所在地公安提请DNA匹配等等,每个环节都需要大量沟通。

在整个事情当中,技术其实只是一小部分,尽管是极为关键的一部分。

4月1日,DNA比对成功。

付贵没想到自己的DNA送上去一个周就出了结果。他有些不相信,觉得是不是搞错了。但是,当越来越多的志愿者与他联系后,他失眠了。

“我当晚就睡不着了。一直到晚上两三点我都没有睡着。我那个时候脑海里一直是这个事情,它会不由自主地浮现出来。当时我心里有些小激动,就是有些兴奋,也有些不安定的情绪,睡不着觉。”付贵说。

还有一个细节,付贵的父亲付光发当时就推断孩子可能被拐到了福建或者安徽。因为,镇上有些人曾往返过这两个地方,他甚至将目标锁定在一个人身上。

“娃没出事的时候还能见着这个人,自从出事了就没再见过这个人。”他说。

他的直觉与分析是对的。但他苦于没有任何证据,也就作罢。当时,也没有别的力量帮助他更进一步。

公安部门打拐也是个老大难,涉及非常高的成本。一次跨区打拐的经费至少三五万,很多基层公安部门一年的办案经费也就七八十万。而做DNA,成本高,又太复杂。

而这次百度和宝贝回家的探索,虽然只是一个开始,但已让许多人看到了未来。

毕竟,照片相对容易找到,识别技术也会越来越成熟。据说双方已经建立了稳定的合作关系。付贵的案例虽仍是孤例,但对双方士气来说,是一种莫大的鼓励。在付贵亲人的泪水里,有多少无穷的期待哦。

是的,还有更多没有找到亲人的人,他们更需要鼓励。在AI这条路上,过去一段,被人质疑老是技术派、没有应用场景的百度人工智能,面前突然出现一个丰富的世界。

不要再抱怨这类技术派了吧。技术立身的企业,总有一个技术研发、成熟、落地的演进曲线。

在一个人工智能时代初启的时刻,李彦宏与他创立的百度确实承受了巨大的压力。因为,他们的面前,也类似华为创始人任正非说的,也是一个巨大的无人区,没有真正成熟的应用场景,它需要不断磨砺、试错,甚至付出高昂的代价。对一家中国互联网企业且是上市公司来说,将人工智能树立为愿景,已经是带有强烈的重塑意志。

技术是冰冷的,它诞生在日复一日的冷板凳里,背后有无数的人的汗水与努力;技术也是火热的,它有着丰富的人间情怀。一旦它拨开应用的迷雾,与无数民众面临的现实问题或种种束缚碰撞时,一定会有无穷的力量让人感动。

百度AI帮民众成功寻亲的意义,绝不在于解救一个孩子或几个孩子,它像一颗石子落入辽阔的湖面,生成丰富的涟漪,扩展到更广的区域。在辽阔的中国播种下技术驱动的种子,推动我们的会消除种种壁垒与隐患,让一切变得更为美好。
夸克点评。覆盖百度百家、今日头条、一点资讯、创事记以及腾讯、搜狐、凤凰、网易等客户端。

商业合作请联系:QQ:2223843522    wangruchen2012@qq.com


    关注 夸克点评


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册