曾放言对标谷歌微软,股价猛涨的科大讯飞如何看待人工智能时代?

 

现在,我们正在迎接一个语音交互为主、其他交互为辅的时代。...







编者按

被评为全球50家最聪明的公司之一的科大讯飞近日在投资者关于公司主要竞争对手的询问时,回复到公司在人工智能领域主要对标的是谷歌微软等国际一流厂商。

科大讯飞占据中国语言技术市场的比例高达70%,这也许是它敢叫板谷歌微软的底气。这样的一家公司,对人工智能是怎样的一种看法?科大讯飞产业投资董事长徐景明在“中欧新生代创业领袖成长营”第五期第六模块上的分享给出了他的答案。

文 / 徐景明 科大讯飞产业投资董事长

本文根据徐景明先生在“中欧新生代创业领袖成长营”第五期第六模块:资本创新与经营之道”的演讲整理而成。

谈到人工智能,我们首先要思考的一个问题就是,人类的智慧是如何产生的?《人类简史》中就提到,两百万年前地球就已经出现了和人一样脑容量的生物,但直到七万年前,智人才开始走向全球统治世界。其中有一个非常重要的原因就是语言的出现。

智人由于在语言方面取得了突破,首先可以传递相互之间的信息,生存条件、狩猎条件得到了极大提升;其次可以反馈社会信息,组成群体;第三就是传递概念的信息,而现在的企业、法律、宗教无不是建立在人们之间形成并且达成共识的概念之上。

基于此,因为有了语言,人类的知识才开始沉淀,于是有了文化的传承,这个时候,人类的智慧开始涌现。

在整个IT技术的发展浪潮中,人机交互处在怎样的位置上?从大型机到小型机,从PC到移动互联网……人机交互技术起到了非常重要的作用。

早期我们与大型机和小型机的沟通方式是纸带打孔,然后键盘出现了,再到后面视窗操作系统。这是一个机器不断小型化、不断进入更多家庭,并且人机交互的过程不断优化和便捷的过程。再后来,苹果将触屏技术做到了突破和实用,以智能手机为代表的智能终端进入我们的口袋。
1
语音:人机交互现在时


现在,我们正在迎接一个语音交互为主、其他交互为辅的时代。

评价机器说话的技术在业界有一个5分制的标准,其中最关键的是自然度,5分是播音员水平,4分是普通人说话的水平。1995年,机器合成的声音很像卡通片里的机器人,一个字一个字地蹦出来,虽然听得懂,但没有达到自然的程度。当时采用了单词拼接技术,词之间的能量、时长、音高等一系列复杂参数很难解决。

到了2001年,取得了很大的进展,但仍能听出是机器在说话,没有真人发声时的抑扬顿挫。而现在的语音合成效果自然度达到了4.5分,已经超过了普通人,进步十分明显。

除了中文,我们在多语种合成方面也取得很大进展,从2006年开始,我们就在全球语音合成大赛暴风雪竞赛中一直囊括各项指标的第一名,先后比的是英文、印地语,朗诵小说、故事等。机器可以合成各种声音,就可以被用到生活和工作的诸多方面,比如解决辅助阅读、辅助教学、导航等。



而在语音识别方面,大家已经越来越感受到这项技术带来的便利了——除了讯飞输入法这样的日常应用之外(语音识别准确率已达97%以上),语音识别技术在许多重要的场合都有应用,比如安全、防诈骗这样的2B领域。

也许大家认为,语音识别就是嘴巴对着手机讲话,但对我们来说这只是语音交互技术的一小步——因为我们人和人之间的交互场景并不如此。比如在车载环境,高噪音、高复杂的情况下的识别问题。现在,基本全国所有的主流车厂和国际的著名车厂都在跟讯飞合作。在2015年的宝马评测里,我们比全球第二名的系统大概高出了12%的识别准确率。现在,我们在车载这种高复杂环境下,识别正确率已经可以做到90%以上。

其实,在国内能够使用这种技术的场景非常多,举个例子,医生在给病人看病的时候,他们的双手是很忙碌的,这时候写病历很麻烦而且不及时,我们就可以通过语音技术把它实现。还有法院、家电、机器人、玩具等等众多领域。

现在讯飞输入法已经拥有了4亿的用户,大部分都是通过口碑传播。不过,虽然语音产品为人所熟知,实际上人机交互绝对不仅限于语音,还包括手写、图像、OCR。讯飞输入法连续手写识别准确率已达惊人的98%;对学生手写体的OCR识别,准确率已达到95%以上。

讯飞在人工智能领域已取得明显成果,举两个教育领域的例子。一是口语作文的评测。现在大家越来越重视学生听、说的能力。传统普通话、英语口语考试模式是老师对学生口语进行封闭测听,但老师的水平本身层次不齐,每天情绪不断变化,评分难免会不客观、不标准,而机器的准确度和平均误差都要比人工好很多。现在中文普通话评测已经全国全面机测,英文正在从广东高考、江苏中考成功应用的基础上向全国大规模推广。

第二,就是机器的自动阅卷已经达到了专家的水平。长期以来,阅卷都是老师拿笔批阅,后来,选择题可以用答题卡扫描,但对于大量的主观题、阅读理解等仍然没法解决。而现在,这个问题也可以通过人工智能解决了,机器通过学习可以去评判英语作文、中文作文。机器可以从词汇、语法、篇章结构等方面全面评估,并且更客观、更快速。

未来有两个大的发展机遇,一个是以语音为主、键盘为辅的人机交互时代的到来;第二是人工智能像水和电一样进入到每一个行业,深刻地改变这个世界。

同时我们也看到,人工智能的概念在今年非常热,甚至出现了一些十分夸张的说法,我认为有些过了。人工智能可以帮助解决我们很多问题,让我们可以更自然、更轻松地处理一些事情。
2
人工智能只是社会演进的过程


人工智能的发展有三个阶段:计算智能、感知智能、认知智能。

1997年IBM“深蓝”计算机下赢了国际象棋世界冠军卡斯帕罗夫,里面就使用了计算智能,它的计算能力和储存能力都足够强大。感知智能就是机器能够像人一样具备感知的能力,这种能力了其实在很多方面已经超过了人类。比如听的角度,人的耳朵只能听到很小的波段,而机器能够听到超声波、次声波;视觉方面,人只能看到可见光,而机器可以看到红外线、紫外线——所以机器在感知智能方面超过人类是必然的。

未来机器可以帮助我们听懂世界上任何语言,人与人之间的信息沟通没有障碍。更具挑战的是机器向认知智能的进步,就是让机器具备理解、会思考的能力。为什么AlphaGo能赢得了柯洁,围棋是算不完的,但人工智能的发展使机器能够学习人类有史以来的所有棋谱,进行逻辑推理,并且做出决策和判断。除了围棋之外,它的应用空间非常得广阔。

人工智能的到来的确比我们想象得更快。有报告称,许多工作可以被机器自动化。我们也在思考这个问题,人工智能与人之间是什么关系?我并不认为这是一个岗位是否会被替代的问题,这应该是一个人与机器融合、结合的过程。
也就是说,机器并不独立于我们存在,而是经由我们设计、开发、生产出来,为我们服务的。所以我们所做的所有工作,都是为了我们的人类生活的更美好。机器究竟是善是恶?汽车的出现一定将马车颠覆了,但它又产生了许多新的职业;计算机的产生替代了许多工作,但又出现了一大批新的职业,我觉得这只是社会演进的过程。而机器作为人的工具朋友,这一属性是不会变的。这也契合科大讯飞的企业文化——用人工智能建设美好世界。

孙正义曾提出一个复合方程式“生产性×劳动人口=竞争力”,日本在生产性和劳动人口两方面均处劣势,竞争力下降也就在所难免。他认为,日本若能导入3000万台可24小时工作(3倍于正常人)的产业机器人,就相当于增加了9000万制造业劳动人口,而支付给每台机器人的“平均月薪”仅为1.7万日元。这无疑将让日本一举两得地扭转在生产性和劳动人口方面的劣势。我们一定要对这个趋势保持高度的关注。

随着人工智能时代的到来,在这样此起彼伏的浪潮中会产生怎样的创新,商业模式会出现什么样的变化,这些都值得我们好好去思考。


    关注 中欧商业评论


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册