你会被机器取代吗?看你干嘛了

 


机器学习和人工智能的发展并不是一朝一夕之功。那是在遥远的60年前的一个夏天,麦卡赛、明斯基、罗切斯特和申农等为首的一批有远见卓识的年轻科学家坐在一起神聊,琢磨着搞点新玩意,最后他们想出了用机器模拟智能的这一高难度动作,大家都很兴奋,并将这一概念命名为「人工智能」,由此开启了后世电影巨大的意淫空间和幻想素材。但是,学术领域的发展是远远落后电影导演的想象力的,他们潜入深水河底默默耕耘,力图捕捉每一个创意的火花,但是真的很难捕捉!直到1997年5月,IBM 的深蓝计算机打败了国际象棋大师卡斯帕洛夫,人工智能算是浮出水面透了口气,马上又沉下去了。

直到今年,Google 收购的 DeepMind 研发出了足以对抗人类顶尖围棋高手并战而胜之的 AlphaGo,机器学习和人工智能被彻底推向前台,重新成为世界的焦点。现在人们讨论的热点成了,机器的觉醒,奇点,人有用没用,有啥用,多少人的工作会被机器取代,失业了谁为你煮面……等话题。

我觉得吧,机器当然会取代一部分人的工作,其实已经取代了很多了……但是,机器不能替代围棋的魅力,不能替代音乐和绘画的魅力,不能替代体育和文字的魅力……能替代啥呢?比如你是个速记员,可能要小心了。

他叫杨枫,是一名阿里小二。2015年在布达佩斯举行的速记届「奥运会」——第50届国际速记大赛上,他击败众多海外选手获得了亚军,是中国最快的速记人,他还是马老师的「御用」速记师。


今天,杨枫又一次坐在PK台上。不过他面对的不是人!真的,不!是!人!

擂台另一边,是阿里云iDST的科学家们打造出来的语音识别系统。iDST是阿里云专注于人工智能等前沿技术的神秘团队。双方在阿里云年会上上演了一场「人机大战」。

所谓语音识别技术,就是把语音转换成文本,也称为自动语音识别。语音识别是人工智能领域极为重要的前沿技术。在美国政府关于限制发放签证的「Technology Alert List」中,语音识别赫然在列,与核武器、火箭技术等同在「黑名单」之中。

人机大战以阿里云总裁胡晓明的一段即兴演讲展开,这边语音还未落,那边屏幕上已经弹出机器人和速记员的速记结果。神奇的是,机器人还能根据胡晓明语境的变化,回头对前面的记录进行调整。



除了胡晓明的演讲声,现场所有同学都屏住了呼吸,小编想到一句小学时经常用的造句——教室安静得,一根针掉在地上都能听到~~

经过核对评估,机器人以微弱优势险胜杨枫同学,取得人机大战的胜利!

评估取胡晓明前八分钟的演讲录音,对比机器人和杨枫出现多字、少字以及错字的情况,出错少的一方获胜。机器人出现了明显词汇错误,而杨枫同学的正确率从头到尾非常高,但因为漏打了几个字,错失了机会。



得知最终结果,iDST语音识别算法老大智捷抬了一下眼镜,依旧很淡定,「虽然已经在接近世界一流的速记师的路上了,但人工智能还有很长一段路要走。在噪声、口音以及对未见到过的数据的适应性上,人类显然还是更胜一筹」。杨枫同学也很大气,「不管是人工智能还是人取胜,其实都是人类的胜利」。

其实,从去年开始iDST的语音识别系统,已经在阿里巴巴的多个业务场景中应用了。每天,集团和蚂蚁的客服小二总共会接听约18万通电话,沉淀的语音数据时长超过1万小时。来自天南海北的客户将需要咨询的问题、需要吐槽的痛点、需要投诉的纠纷通过客服电话源源不断反馈回公司。这些宝贵的客户心声在阿里会被记录下来,并成为改善我们产品和服务的动力。

在自动语音识别技术应用之前,集团与蚂蚁每天海量的电话客服量,如果通过人工一个一个听、一个一个质检,是「不可能完成的任务」。但从去年开始,客服每接听一个电话,都会立刻启动一个叫「风语者」的系统,它就是自动语音识别技术,将语音转变成文字,千分之三的人工抽检可以瞬间升级为100%的自动质检。

先由机器筛选出可疑的小二问题,再由人工质检来确认。机器来「大海捞针」,人工来「一锤定音」。

这只是其中之一应用场景,搭载阿里YunOS的各种设备(手机、电视盒子、手表、汽车、IOT设备等)、阿里小蜜以及手淘等等,现在都已经用上了阿里云的语音识别系统了。

智捷说,为他人提供可能,帮别人成功,这才是语音团队的初心。

也许在并不远的未来,你坐在阿里汽车里,用语音指令,耳边开始流淌「生活不止眼前的苟且」;你对支付宝轻轻耳语几句,这个月的家用就进入老婆的账户……

弱弱问一句,「这样日以继夜地干,会不会太辛苦?」
然后立刻被一大坨白眼掀翻了,「你难道不觉得这件事情很酷吗?」

智捷说,人工智能将改变人类和世界的关系。但对于人类而言,哪怕是微小的进步,也许能通往你我还不能企及的神秘宏大。我们正站在变革的边缘,而这次变革将和人类的出现意义一样重大。

关于人机大战的几个细节

机器人在哪里,为什么木有机器人?

机器人并不在现场,而是在云端使用了阿里云新一代高性能计算平台HPC,单节点计算能力能达到16 Tflops。它们是机器人的大脑,运用了很大的模型和很高效的解码器。

机器人是怎么「听」懂语音的?

它收集了大量人类真实语音,通过学习的方式,建立了一个很大的模型,当语音输入的时候,机器人能通过模型搜索到文字。

机器人有可能取代速记员吗?

其实机器人的作用还是在于帮助普通人做速记,把普通人从简单重复的劳动里面解脱出来。
据介绍,目前测试了几个高年级同学的讲话。马老师的录音转化准确率最高,胡晓明、逍遥子、Lucy紧随其后,准确率都在百分之九十多。

目前,唯独对王坚博士的浙江普通话,机器人表示还有点不淡定。

攻城狮群活动预告:

本周六邀请了硅谷的陈天做第二次技术分享,这次分享的内容是:「抽象的能力」。具体时间是本周六下午一点。

如果编程有可能成为你的职业,那么 5-10 年的学习和实践时间是需要的,因为你可能要学习编程语言、操作系统、算法、数据库(Sql 的 NoSql 的)、Web 开发等等,还有各种数不清的引擎和架构。这还不够!你还需要抽象的能力。合格的程序员是不会写出诸如「摧毁地球」这样的程序的,他们会抽象出一个函数叫「摧毁行星」,然后把地球当一个参数传进去。如果你把参数设置成泛型,还可以摧毁恒星、行星、白矮星黑矮星、中子星、夸克星、彗星、双子星……周六,听陈老师讲「抽象的故事」!

陈老师上次在工程师群分享的内容是:函数式编程。他目前就职一家创业公司 adRise,任职 VP of Engineering,技术管理者,同时冲在技术第一线。

很多人埋怨国内的工作节奏和生活环境,今天就让你们看看陈天每天累成「狗」的生活,他在硅谷的工作节奏是这样的:清晨 5:25 被闹铃吵醒,经过10分钟的无效挣扎,陈老师像猎豹一样一跃而起,在15分钟内完成这些动作:起床,上厕所,洗漱,洗澡,穿衣,打包,下楼,穿鞋,抄起一包吃的等动作,然后驱车到地铁站准备赶 6:13 的火车。经过一系列左冲右突超速行驶等高危动作,陈老师停好车一路狂奔,赶上了马上要开走的火车。心神普定,赶紧打开笔记本开启一天的工作生活。

7点半到下午5点是陈老师高效工作的一天,当5点钟的铃声响起,无论他在写代码还是开会,都必须立刻停止当前的行为,收拾东西出门,一路跳跃穿行并躲过特大号的红绿灯才能赶上 5:20 的火车回硅谷。开车回家已经7点多了,晚饭,陪伴家人,写文章,处理公司的紧急事务,最后带着一堆没有修复的 bug 进入了梦乡……清晨 5:25 的闹钟响了!

让自己有节奏的忙起来!有时候我甚至认为,这可能就是生命的全部意义。

关注 MacTalk,点击左下角「卖桃服务」,参与攻城狮群的活动。


    关注 MacTalk


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册