战胜世界亚军速记师的机器人,人工智能技术直追alphago

 

他叫杨枫,是一名阿里小二。2015年在布达佩斯举行的速记届“奥运会”——第50届国际速记大赛上,他击败众多海外选手获得了亚军,是中国最快的速记人,他还是马老师的“御用”速记师。

今天,杨枫又一次坐在PK台上。不过他面对的不是人!真的,不!是!人!

擂台另一边,是阿里云iDST的科学家们打造出来的语音识别系统。iDST是阿里云专注于人工智能等前沿技术的神秘团队。双方在阿里云年会上上演了一场“人机大战”。

所谓语音识别技术,就是把语音转换成文本,也称为自动语音识别。语音识别是人工智能领域极为重要的前沿技术。在美国政府关于限制发放签证的“Technology Alert List”中,语音识别赫然在列,与核武器、火箭技术等同在“黑名单”之中。

人机大战以阿里云总裁胡晓明的一段即兴演讲展开,这边语音还未落,那边屏幕上已经弹出机器人和速记员的速记结果。神奇的是,机器人还能根据胡晓明语境的变化,回头对前面的记录进行调整。

除了胡晓明的演讲声,现场所有同学都屏住了呼吸,小编想到一句小学时经常用的造句——教室安静得,一根针掉在地上都能听到~~

经过核对评估,机器人以微弱优势险胜杨枫同学,取得人机大战的胜利!

评估取胡晓明前八分钟的演讲录音,对比机器人和杨枫出现多字、少字以及错字的情况,出错少的一方获胜。机器人出现了明显词汇错误,而杨枫同学的正确率从头到尾非常高,但因为漏打了几个字,错失了机会。

得知最终结果,iDST语音识别算法老大智捷抬了一下眼镜,依旧很淡定,“虽然已经在接近世界一流的速记师的路上了,但人工智能还有很长一段路要走。在噪声、口音以及对未见到过的数据的适应性上,人类显然还是更胜一筹。”

杨枫同学也很大气,“不管是人工智能还是人取胜,其实都是人类的胜利”。
其实,从去年开始iDST的语音识别系统,已经在阿里巴巴的多个业务场景中应用了。

每天,集团和蚂蚁的客服小二总共会接听约18万通电话,沉淀的语音数据时长超过1万小时。

来自天南海北的客户将需要咨询的问题、需要吐槽的痛点、需要投诉的纠纷通过客服电话源源不断反馈回公司。这些宝贵的客户心声在阿里会被记录下来,并成为改善我们产品和服务的动力。

在自动语音识别技术应用之前,集团与蚂蚁每天海量的电话客服量,如果通过人工一个一个听、一个一个质检,是“不可能完成的任务”。

但从去年开始,客服每接听一个电话,都会立刻启动一个叫“风语者”的系统,它就是自动语音识别技术,将语音转变成文字,千分之三的人工抽检可以瞬间升级为100%的自动质检。

先由机器筛选出可疑的小二问题,再由人工质检来确认。机器来“大海捞针”,人工来“一锤定音”。

这只是其中之一应用场景,搭载阿里YunOS的各种设备(手机、电视盒子、手表、汽车、IOT设备等)、阿里小蜜以及手淘等等,现在都已经用上了阿里云的语音识别系统了。

智捷说,为他人提供可能,帮别人成功,这才是语音团队的初心。

也许在并不远的未来,你坐在阿里汽车里,用语音指令,耳边开始流淌“生活不止眼前的苟且”;你对支付宝轻轻耳语几句,这个月的家用就进入老婆的账户……

“这样日以继夜地干,会不会太辛苦?”小编弱弱问。

然后立刻被一大坨白眼掀翻了,“你难道不觉得这件事情很酷吗?”

智捷说,人工智能将改变人类和世界的关系。但对于人类而言,哪怕是微小的进步,也许能通往你我还不能企及的神秘宏大。

我们正站在变革的边缘,而这次变革将和人类的出现意义一样重大。
关于人机大战的几个细节

☆机器人在哪里,为什么木有机器人?

机器人并不在现场,而是在云端使用了阿里云新一代高性能计算平台HPC,单节点计算能力能达到16 Tflops。它们是机器人的大脑,运用了很大的模型和很高效的解码器。

☆机器人是怎么“听”懂语音的?

它收集了大量人类真实语音,通过学习的方式,建立了一个很大的模型,当语音输入的时候,机器人能通过模型搜索到文字。

☆机器人有可能取代速记员吗?

其实机器人的作用还是在于帮助普通人做速记,把普通人从简单重复的劳动里面解脱出来。

据介绍,目前测试了几个高年级同学的讲话。马老师的录音转化准确率最高,胡晓明、逍遥子、Lucy紧随其后,准确率都在百分之九十多。

目前,唯独对王坚博士的浙江普通话,机器人表示还有点不淡定。


    关注 程序猿


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册