战胜世界亚军速记师的机器人,人工智能技术直追alphago
今天,杨枫又一次坐在PK台上。不过他面对的不是人!真的,不!是!人!
擂台另一边,是阿里云iDST的科学家们打造出来的语音识别系统。iDST是阿里云专注于人工智能等前沿技术的神秘团队。双方在阿里云年会上上演了一场“人机大战”。
所谓语音识别技术,就是把语音转换成文本,也称为自动语音识别。语音识别是人工智能领域极为重要的前沿技术。在美国政府关于限制发放签证的“Technology Alert List”中,语音识别赫然在列,与核武器、火箭技术等同在“黑名单”之中。
人机大战以阿里云总裁胡晓明的一段即兴演讲展开,这边语音还未落,那边屏幕上已经弹出机器人和速记员的速记结果。神奇的是,机器人还能根据胡晓明语境的变化,回头对前面的记录进行调整。
除了胡晓明的演讲声,现场所有同学都屏住了呼吸,小编想到一句小学时经常用的造句——教室安静得,一根针掉在地上都能听到~~
经过核对评估,机器人以微弱优势险胜杨枫同学,取得人机大战的胜利!
评估取胡晓明前八分钟的演讲录音,对比机器人和杨枫出现多字、少字以及错字的情况,出错少的一方获胜。机器人出现了明显词汇错误,而杨枫同学的正确率从头到尾非常高,但因为漏打了几个字,错失了机会。
得知最终结果,iDST语音识别算法老大智捷抬了一下眼镜,依旧很淡定,“虽然已经在接近世界一流的速记师的路上了,但人工智能还有很长一段路要走。在噪声、口音以及对未见到过的数据的适应性上,人类显然还是更胜一筹。”
杨枫同学也很大气,“不管是人工智能还是人取胜,其实都是人类的胜利”。其实,从去年开始iDST的语音识别系统,已经在阿里巴巴的多个业务场景中应用了。
每天,集团和蚂蚁的客服小二总共会接听约18万通电话,沉淀的语音数据时长超过1万小时。
来自天南海北的客户将需要咨询的问题、需要吐槽的痛点、需要投诉的纠纷通过客服电话源源不断反馈回公司。这些宝贵的客户心声在阿里会被记录下来,并成为改善我们产品和服务的动力。
在自动语音识别技术应用之前,集团与蚂蚁每天海量的电话客服量,如果通过人工一个一个听、一个一个质检,是“不可能完成的任务”。
但从去年开始,客服每接听一个电话,都会立刻启动一个叫“风语者”的系统,它就是自动语音识别技术,将语音转变成文字,千分之三的人工抽检可以瞬间升级为100%的自动质检。
先由机器筛选出可疑的小二问题,再由人工质检来确认。机器来“大海捞针”,人工来“一锤定音”。
这只是其中之一应用场景,搭载阿里YunOS的各种设备(手机、电视盒子、手表、汽车、IOT设备等)、阿里小蜜以及手淘等等,现在都已经用上了阿里云的语音识别系统了。
智捷说,为他人提供可能,帮别人成功,这才是语音团队的初心。
也许在并不远的未来,你坐在阿里汽车里,用语音指令,耳边开始流淌“生活不止眼前的苟且”;你对支付宝轻轻耳语几句,这个月的家用就进入老婆的账户……
“这样日以继夜地干,会不会太辛苦?”小编弱弱问。
然后立刻被一大坨白眼掀翻了,“你难道不觉得这件事情很酷吗?”
智捷说,人工智能将改变人类和世界的关系。但对于人类而言,哪怕是微小的进步,也许能通往你我还不能企及的神秘宏大。
我们正站在变革的边缘,而这次变革将和人类的出现意义一样重大。关于人机大战的几个细节
☆机器人在哪里,为什么木有机器人?
机器人并不在现场,而是在云端使用了阿里云新一代高性能计算平台HPC,单节点计算能力能达到16 Tflops。它们是机器人的大脑,运用了很大的模型和很高效的解码器。
☆机器人是怎么“听”懂语音的?
它收集了大量人类真实语音,通过学习的方式,建立了一个很大的模型,当语音输入的时候,机器人能通过模型搜索到文字。
☆机器人有可能取代速记员吗?
其实机器人的作用还是在于帮助普通人做速记,把普通人从简单重复的劳动里面解脱出来。
据介绍,目前测试了几个高年级同学的讲话。马老师的录音转化准确率最高,胡晓明、逍遥子、Lucy紧随其后,准确率都在百分之九十多。
目前,唯独对王坚博士的浙江普通话,机器人表示还有点不淡定。
关注 程序猿
微信扫一扫关注公众号