造就译  Viv来了,跟她比起来Siri就是个弱智

 

打造了一个语音控制的个人助理,让她连入你所有的设备,她将满足你的任意需求。...



全文翻译自《theguardian》“Meet Viv: the AI that wants to read your mind and run your life”一文。

作者 / Zoë Corbyn

磨磨蹭蹭离开公寓,我发现手机上的打车应用不灵光了,直接导致迟到Viv位于加州圣何塞的办公室。

一直等着我的达格·吉特劳斯(Dag Kittlaus)却从这件事上看到好的一面。“你这一路磕磕绊绊,正好说明Viv将对我们非常有帮助,”他说,“只要说一句‘我要去圣何塞,告诉我该怎么走’,Viv就知道你距离火车站有多远,下一班火车何时到站,距离你最近的汽车在哪里,路程的花销是多少……那岂不是很好。”

吉特劳斯是Viv的联合创始人兼首席执行官,这是一家成立三年的人工智能初创公司。截至目前,Viv已经完成3,000万美元的融资,投资者包括为马克·扎克伯格(Mark Zuckerberg)和其他科技界大佬打理财富的艾考尼克资本(Iconiq Capital)。

Viv的办公室坐落在圣何塞市中心,一栋四四方方的写字楼。该公司正在那里开发吉特劳斯所谓的“全局性大脑”,即一种新开发的语音交互虚拟个人助理。依据用户的个性,Viv将能执行数不尽的任务。而且,它将不只是寄身于一部手机,而是被整合到各式各样的设备上,比如冰箱、汽车。“告诉Viv你想要什么,它将为你达成所愿,”吉特劳斯说道。
“我们共同认定,Siri只是一部更加宏伟的大戏的序幕而已。”

——达格·吉特劳斯
这是一个雄心勃勃的项目,但吉特劳斯并非初出茅庐。他参与创办的上一家公司发明了Siri,这个最早投入实用化的虚拟助理现在已然成为了苹果产品的标配功能。2010年,苹果收购Siri公司,交易额据说达到了2亿美元。
2011年,Siri登陆iPhone,为世界带来了一种跟移动设备进行交互的新方式。不久之后,谷歌和微软也竞相推出了各自的虚拟助理。再往后,我们又看到亚马逊发布了语音交互硬件Echo,以及Facebook推出的实验性虚拟助理M。

不过,吉特劳斯表示,所有这些虚拟助理在功能上都还存在局限性。于是便有了Viv的诞生。

“当你拥有了一个功能强大一万倍的系统时,会发生什么?”他自问自答,“它将改变互联网的经济学。”

市场研究公司CB Insights的研究分析师马修·王(Matthew Wong)表示,虚拟助理是大型公司目前正在竞相追赶的一个领域。科技巨头们急切地想要获取新的技术,以使自己的产品变得更加先进——让日常安排实现自动化这件事大有商机。如果他们能够做成这件事,我们将在自己的手机上花费更多的时间,这就意味着更多的广告营收和设备销量。

对初创公司来说,虚拟助理是盈利潜能非常巨大的领域。“一旦有初创公司宣布自己在做这类项目,便会立刻引来Facebook和谷歌等硅谷巨头,”马修说道。比如Wit.ai公司,它的技术能够把语音和文本转化为可操作的数据,只一年多时间就被Facebook收归旗下。正是Wit.ai的技术帮助Facebook开发出了M。

“在未来,我们将用对话的方式跟电脑互动。”西雅图艾伦人工智能研究所(Allen Institute for Artificial Intelligence)的负责人奥伦• 埃齐奥尼(Oren Etzioni)这么说道。他又补充说,手机也是如此。

“现实是,跟我们理想的功能相比,现有所有设备都还略显不足。”埃齐奥尼预见的未来属于这样一种公司,他们开发的个人助理就像优秀的酒店门房——你可以跟它进行复杂的对话,从它那里得到高质量的建议,并让它为自己打理好生活的方方面面。
Viv联合创始人兼首席执行官:达格·吉特劳斯

2008年,Siri公司从硅谷非营利性研究机构斯坦福国际咨询研究所(SRI International)分拆出来,尔后开发出了Viv的前身Siri。吉特劳斯一直在从事早期移动互联网的研发,他在2007年被斯坦福国际咨询研究所招至麾下,担任驻点创业者。这让他跟软件工程师亚当·奇耶(Adam Cheyer)有了密切接触,后者是Calo(一种拥有学习和组织能力的认知助手)项目的负责人。

这是一个耗资2亿美元、耗时5年时间的人工智能项目,本来是打算交给军方使用,出资方是美国国防部下属研究机构国防高等研究计划署(Darpa)。吉特劳斯说服奇耶相信,Siri跟手机是绝佳搭配。

他们对自己的想法进行了打磨,开发了一个原型产品,之后又引入了另一位技术联合创始人汤姆·格鲁伯(Tom Gruber)。

iPhone应用版的Siri在2010年年初正式上线。

透过有色玻璃窗,午后的阳光照在一排修长的棕榈树上,吉特劳斯为我指出了Siri公司原先所在的大楼。他回忆起自己接到史蒂夫·乔布斯(Steve Jobs)来电的那一幕。

“他说,‘我们很喜欢你们正在做的事情,你们明天能来我家聊一聊吗?’”吉特劳斯说道。次日,Siri的几个创始人跟乔布斯进行了一次长谈。“我们决定把它卖给苹果,因为乔布斯跟我们说,‘让我们改变世界协同工作的方式’,那可真是无法抗拒。”

在接下来的一年半时间里,吉特劳斯在苹果领导团队为推出iPhone版Siri做准备,奇耶和格鲁伯则担任工程技术的负责人。在Siri发布的次日——也就是史蒂夫·乔布斯去世的那一天——吉特劳斯因家庭原因从苹果离职。奇耶则比吉特劳斯多呆了九个月,格鲁伯目前仍在苹果工作。

Viv是拉丁语中代表“生命”的词根,它的创意诞生于2012年年中,当时吉特劳斯、奇耶以及Siri公司的另一位软件工程师克里斯·布里格姆(Chris Brigham)正在商量接下来要做什么。布里格姆对现有个人助理因技术和商业原因受到限制的情况感到沮丧,他提出了关于Viv的最初设想。“我们共同认定,Siri只是一部更加宏伟的大戏的序幕而已。”吉特劳斯说道。
吉特劳斯掏出自己的手机,对Viv的原型产品进行了演示。他对着手机说,“我需要乘车去看最近的儿科医生。”Viv列出了一份儿科医生的名单,根据距离由近及远进行了排序,并标明了在线医生预约服务ZocDoc对他们的评分。

吉特劳斯选中了其中一个,手机上显示出能够过来接他的网约出租在哪个位置。“如果我点下去,就会有一辆汽车过来接我,”他说,“看看这些服务是如何协同工作的。”



他又试了试另一个任务,“给我妈送一打黄玫瑰。”Viv可以把联系人信息跟提供全国送货的在线花店服务衔接在一起。吉特劳斯表示,Viv能够完成的其他任务还包括:“在我去兄弟家的路上,我需要买一些配千层面的好酒”,以及“在3月的最后一周,我要带孩子去加勒比海地区度假,给我找一个落脚的地方。”

对应的,我用Siri和谷歌的虚拟助理测试了这些请求,它们都无法很好地处理。吉特劳斯说,Viv先进的地方在于它采用了完全开放的设计。

任何公司或个人如果想要给任何服务、产品或知识添加一个可以说话的组件,都能接入Viv的网络,让其与已经存在的其他服务、产品或知识协同工作。其他虚拟助理却是封闭的。比如Siri,唯有苹果公司有权决定它要整合哪些功能。
Viv最大的秘密是把不同服务整合到一起的技术,它可以在实际使用中响应,并没有预置的用户请求。“它是一种可以自己编写程序的程序,这是你调整数千种彼此互不相关的服务、让它们一同发挥作用的唯一方式,”吉特劳斯说道。

其他个人助理一般都是由开发者预先设置好了针对各种请求的回应方式,本质其实是在照本宣科。要设想出用户可能询问的所有事物的组合,那是不可能做到的。他们除了另辟蹊径之外别无选择。而Viv还将包含自主学习的要素,随着对你喜好的掌握加深,它会相应做出调整。

吉特劳斯表示,用户一开始可以期待看到一款手机应用,但他们更大的志向是把Viv整合到包括汽车在内的各种设备当中。他想象Viv的标志变得无处不在。“不管你在什么东西上面看到它,都意味着你可以跟那个东西直接对话,”他如是说。毫无疑问,这需要时间——公司需要时间把自己的服务连接进来,用户需要时间接纳它。但吉特劳斯也透露,全球规模最大的消费类电子公司已表示“很有兴趣参与进来”。

吉特劳斯认定,Vive拥有颠覆互联网经济学的潜力。目前,企业每年要花上百亿美元用于投放谷歌在线广告,很多网络流量是基于网页用户的关键词搜索。但是,如果用户的请求由Viv负责处理,那将可以绕过中间商。Viv团队仍然在探索不同的商业模式,其中一项是针对通过Viv完成的每一笔交易收取手续费。

Viv的早期演示给艾伦研究所的埃齐奥尼留下了深刻印象。“他们所谋甚大,如果让我押注一支团队,我会押在他们身上,”埃齐奥尼说道。

埃齐奥尼指出,Viv能够超越简单的话语,跟用户进行复杂的双向对话,这在人工智能领域是一个大难题。Viv可能从一家点评网站抓取数据,告诉你在特定路线上可以买到一瓶“好”酒。

然而,用户势必想要了解更多的详情。比如,这瓶酒的价格在他们的承受范围之内吗?“这里面有非常多的微妙之处,你会希望某个东西来进行处理。”他说道。

此外,Viv还面临着竞争,不仅是那些正在升级自家个人助理的互联网巨头,也包括其他有想法的初创公司。Viv会被出售给其他科技巨头吗,就像Siri那样?吉特劳斯没有排除任何一种可能性。“我们的目标是变得无处不在……我们不会说,实现那个目标存在确定的路径。”

那么,接下来就请Viv亮出自己的本事吧。



吉特劳斯接受采访时谈到了Viv的理念和诸多技术细节,以下是这次采访的纪要:



 你为什么把Viv称为“全局性大脑”?

吉特劳斯:它简化了这个世界,为所有东西都提供了智能界面。我们将向第三方敞开大门,使它真正地无处不在。人们更容易接受对话这种人机互动方式,我们希望让所有人来教会Viv做他们想让它做的事。

 如何使用它?

吉特劳斯:只要和它说话,它就会为完成你安排的任务,想你之所想,劳你之所劳。最终,它将全面理解你每天的日程安排和生活习惯。比如,在圣诞节购物期间,你一边开车一边说道:“把《乔布斯传》寄到我老爹在佛罗里达州的家,并在上面写‘爸爸,祝你圣诞快乐。我爱你。’”Viv回答说:“好,没问题。”然后它就帮你去张罗贺卡的事了。所有的任务都将比现在更加容易完成,尤其是复杂的任务,如通过对话方式来规划行程。

 这是更加先进的个人助手吗?

吉特劳斯:它看上去像是个人助手,但实际上它的能力要大得多。我们希望象征ViV技术标准的大写“V”标志和语音交互在未来能像蓝牙和WiFi那样广泛普及。你将可以跟镜子、房子、汽车、电话、电视、空调和冰箱说话。只要看到“V”这个标志,就意味着你可以和它说话,你知道接下来会发生什么,知道它如何工作。

 这将如何推动Siri技术?

吉特劳斯:最简单的例子是2007年发布的iPhone,里面只有苹果的应用程序。后来,他们推出App Store,这改变了一切。现在人工智能处于类似的阶段,内部产品经理决定Siri、Cortana和Google Now等虚拟助手的功能,然后内部开发人员加以实现。但我们将敞开大门,让企业和个人为这个全局性大脑添砖加瓦并教它做事。Viv就是这种想法的大规模应用。这是应用商店之后的发展趋势。
 Viv将整合现有技术吗?

吉特劳斯:很难说未来将有很多个小的大脑还是有一个大的大脑,可能将是共存的局面。

 这项技术有多先进?当前系统的限制是在算法方面吗?

吉特劳斯:当用户和Viv说话时,Viv会把他们说的话分解成我们所说的“意图”。一旦明白某人想要做什么,Viv就会在百分之一秒内编写一个软件程序,把需要做的所有事情都组织起来,然后执行,最终完成任务。这是一大创新。

许许多多的人不断提交任务,而它一直从中学习。我们的系统将检查更新,然后让它们进入全球网络。由于Viv能够频繁地更新各种新信息和新知识,随着这个生态系统的不断扩大,Viv将变得非常强大。

我们把这称为“指数级编程”,并已经获得了各种相关专利,专利名叫做“动态演化系统的认知架构和市场”。“动态演化”是新鲜事物。

 Viv只能和现有应用配合使用?

吉特劳斯:基本上来说是的。已经在使用那些应用服务的人,以及你知道和喜爱的很多大公司,都将接入Viv,通过它建立联系。把它带到物联网的世界,你将可以和各种各样的东西进行互动。

 你是否已经有明确的合作伙伴?会再次跟苹果合作吗?

吉特劳斯:我们正在和一些大公司讨论分销合作和其他事宜。你能想到的所有汽车公司、几乎每家消费电子公司和所有的互联网公司都是我们的潜在合作伙伴。我们也可能再次跟苹果合作。

翻译 / 何无鱼



陈霖 | 是什么让我们衰老?

田沁鑫 | 中国为什么出不了星球大战这样的超级IP?

简里里 | 我们为什么觉得孤独

王健 | 以“我”为中心的世界

马家辉 | 我们生活在一个没有遗忘权利的时代

苑明理 | 用虚拟的星球,反省我们的世界观

点击标题 查看往期回顾






    关注 造就


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册