一文看全2018 Google I/O大会:AI逐渐人性化 巨头未来也靠它

 

面对微软和谷歌的云AI战略,苹果是否还会继续坚持机器学习的本地化?下个月就会见分晓。...



新浪科技

科技观潮,与浪前行

关注



文|新浪科技 郭晓光 郑峻

5月9日凌晨,为期三天的Google I/O开发者大会在美国开幕。在刚刚结束的主题演讲上,谷歌CEO桑达尔-皮查伊(Sundar Pichai)和各产品线负责人讲解了自家的AI、Android系统、谷歌助手等产品的进展。

今年的主角依然是AI人工智能,它已经融入谷歌产品与软件系统中,但这次,谷歌在讲解AI或产品功能时从理解人类和人性的角度举例,把AI带到了科技与人文的十字路口上。
AI:贴近人性并对人类有帮助
谷歌CEO皮查伊用两个卡通图标举例作为开场白,说明谷歌对信息真实的追求。AI是第一个被提及的话题,皮查伊将之具体到医疗领域,用视网膜扫描诊断疾病的具体案例来解释机器学习的能力,让观众能理解AI对人类的作用——“医疗就是AI能改变的重要领域”。
▲AI帮助判断眼部病情


以往在Google I/O上大谈代码只有码农们兴奋而旁人无感的状况终于有所改进,皮查伊将每个技术点都具体化,例如谷歌相册中找到朋友的婚礼照片,下面会提示是不是要分享给她;或是一张较昏暗的照片提示用户要不要调整。
▲AI应用实例,看到某人照片,手机问要不要分享给她


另外,谷歌公布了自己的人工智能专用芯片TPU3.0,相比上代,它使用液冷,计算力是去年TPU2.0的8倍,可以更快更智能地解决更多问题。但这部分只有两句,并未过多解释。
▲支持水冷的智能芯片
Google Assistant:连声音都更像人类
Google Assistant(谷歌助手)是本次开发者大会介绍的第二个重要新品,它是谷歌的AI智能助手,这次更新带来6种新声音,并且发音更贴近人类自然语言,不那么像机器人发出来的声音。

皮查伊介绍说它的声调、节奏等都更接近人类。他们在录音室里采集了人类的声音,捕捉声音特质,之后分析特征融入Google Assistant中。
▲谷歌助手的语音更自然


谷歌宣布了自己的AI语音助手发布2年后,已经支持30种语音,在80个国家可用;一些细节改变还有:

1)持续性对话,不用每次都喊Hey Google唤醒一次才问一个问题,它可以连续回答;

2)家庭使用场景,例如孩子跟谷歌助手对话的时候,如果他比较礼貌地说“请”字,谷歌助手也会给出更nice的回答——谷歌希望用这种不为人注意的细节,来告诉用户自己的AI助手有多周到。
▲谷歌助手不仅是个语音助手,还对带屏幕的设备进行了优化


除了声音,谷歌助手在视觉表达方面也有所改进。现场采用中国公司联想的“智能显示器”来展示谷歌助手在视觉方面给人们的反馈,还有手机上的语音搜索展示;在开车时候,如果用声音控制,谷歌助手也会融合在谷歌地图上,给人类声音+视觉展示,把导航这件事做得更好。

皮查伊演示了两个极为科幻的场景:

你要理发,喊谷歌助手预定,它会给理发店打电话,并回答出理发店里店员“几点理发”“预定客人的名字”等信息;

或者预定餐馆,如果没位置,它也能学会变通更改预定时间——全程是谷歌助手(机器)在和一个人类流畅的对话,它的声音仿佛一个人类,回答方式也是一个人类,没有机械刻板的痕迹。
▲机器和人类对话约理发,极其科幻的场景


预约理发和餐馆这两个场景非常生活化,这么自然的场景,你手机里的智能助手就能独立完成。谷歌告诉世人,他们真的把自己的智能助理变成了人,并在自己的发布会上演出了科幻片里的情节。

▲谷歌助手与人类对话:预约理发和餐厅
虽然我们相信实际生活中不会像舞台演示这么流畅,但谷歌助手已经展示了目前AI助手的发展方向,就是朝着人类的方向进化。
Google News:AI做新闻
谷歌自己不是媒体不做新闻,但他们的Google News用AI介入了人们阅读新闻方式,第一个特征可以粗略理解为高端版“今日头条”,它的有些方式很像关联阅读,你看了条朝鲜韩国领导人见面的新闻,它会关联推送其他相关新闻。
▲学习用户读新闻习惯,自动生成一个专题


第二个特征,360度报道,让用户了解整个新闻的来龙去脉。比如某地停电,在新闻前后有这件事本身、人们需要做什么,以前以后相关的事件。他们想让用户知道一件事,并在后台绘制出一张脉络图,让用户完整理解这件事——这基本等于机器自己搭建了一个专题。
▲相关阅读推荐


第三个特征是让用户订阅自己需要的媒体,目前Google News已经进入127个国家和地区,在Android和iOS上都能找到。
Android P:帮用户戒掉手机瘾
十年前,谷歌发布了搭载Android系统的首款手机G1,影响了智能手机的变化。如今的Android系统没有大幅变化,一切尽在细节中:

加入了更多的智能体现,例如根据用户习惯判别使用情况来节省电力;

根据用户喜好(手机亮度跳到了多高等)来自动判别亮度,让用户大幅降低手动调整亮度的机会,号称准确率到了60%;

应用预测,学习用户习惯和使用情景,来给用户提供有效的App建议。
▲学习用户习惯来省电


在界面方面,Android系统的界面变得更简单,并加入了更多手势。在这点上,谷歌似乎借鉴了iPhone X的手势(或者说他们都借鉴了webOS),在现场演示的Pixel手机上,底部有个小横条,滑动返回桌面,或是切换App,跟iPhone X实现方式接近。
▲底部滑动条像iPhone X


谷歌希望Android P能帮人了解自己用手机做什么,防止沉迷在数字世界里。比如现在每个App都能统计使用时间,看看你究竟用手机做什么;到睡觉时间提醒人类并把手机屏幕调成灰色——帮用户戒掉手机瘾。

今天Android P Beta测试版已经上线,在谷歌提到的适配手机厂商中大半来自中国:一加,小米,ov与索尼诺基亚等国际厂商放在一起,成为了第一批支持厂商。
▲第一批适配厂商中大半来自中国
Google Maps+Google Lens:兴趣推荐
谷歌给地图加了更丰富的地点相关概念,利用AI和卫星图像技术,可以了解新地址和商家,另外推荐最近的路程和附近最适合你的餐厅。其实类似功能目前高德,百度地图等也有尝试。
▲地图相关推荐不是新功能了


谷歌地图这次跟手机摄像头结合了,例如你不知道在哪,打开镜头,它会采集街头画面,之后将实景与地图结合,告诉用户该向哪走。
▲AR实景导航


这个功能其实是Google Lens与地图的融合,它是一款基于图像识别和OCR技术的人工智能应用,这次被用在地图这种实用场景里;另外Google Lens本身也得到了加强,例如拍一张纸,上面的字可以识别并从纸上“粘贴”到手机里。
▲从现实“粘贴”到电子世界
无人驾驶:车自己预判路况
2016年,谷歌的母公司Alphabet宣布将自动驾驶汽车项目分拆为一家单独的公司Waymo,这次的无人驾驶汽车和部分就由Waymo的CEO John Krafcik上台讲解,他介绍了Waymo无人驾驶汽车的近况:已在亚利桑那州凤凰城上路,AI的介入让无人驾驶的错误已经减少了100多倍,可让无人驾驶汽车更安全。
▲Waymo无人驾驶汽车


目前Waymo有2.5万辆车每天在路上验证各种路况。Waymo的讲解人举了个例子来说明神经网络的学习结果:无人车可以自己预测人们或车在横穿马路、闯红灯等行为提前预判,防止在过十字路口时撞到闯红灯人或车。
▲AI预判路上行为
给AI加上人性
这是一场名副其实的开发者大会,没有硬件发布,也似乎没有一种系统是大革命性更新。这其实已经不是第一年这样了——AI的介入,让每件产品都有了机器学习的属性,更新在了潜移默化中。

相比之下,UI界面改头换面这种表层的惊喜少了,所有的改进似乎都是细枝末节。智能化的演进在每分每秒进行,根据用户使用习惯而悄悄变化。

对比之前,这场主题演讲特殊之处就是无时不忘提到AI对人类的帮助,以及AI资深的人性化(比如教小朋友说”请“),理工男们用这种方式让外界理解自己打造一个“更美好世界”的梦想,这也是硅谷所有科技公司的态度,不同的是,这个目的是AI帮助人类实现的。
AI时代已经到来
颇具戏剧性的是,微软Build开发者大会和谷歌I/O开发者大会今年撞车了,开幕时间只差一天。微软在西雅图,本月7日到9日;谷歌在山景城,本月8日到10日。开发者群体或许各有侧重,但科技媒体就不得不兵分两路。

这两大科技巨头存在着不少业务重合与竞争,正好也是PC时代和后PC时代的两大代表性公司,目前则分别拥有全球最大的桌面和移动操作系统。在PC时代,微软和英特尔的Wintel组合横扫市场;而在后PC时代,谷歌和苹果分割统治了移动平台。

无论是昨天的微软Build大会,抑或是今天的谷歌I/O大会,有着一个共同的主题词——人工智能。AI几乎无处不在,贯穿着两大巨头诸多纷繁复杂的新产品,重新定义了软件服务的体验。毫无疑问,科技行业正在迈进了全新的AI时代。

实际上,谷歌和微软去年就已将AI定义为自己的未来战略。无论是微软CEO所说的“AI重新定义一切”(AI Redefine All),还是谷歌CEO提出的“移动优先转向AI优先”(Mobile First to AI First),两位印度裔CEO的战略实际上同出一源:AI会成为贯穿两位巨人的血液,渗透和提升微软与谷歌的所有产品和业务之中。

从这个角度来看,今年的微软和谷歌I/O大会并没有太多全新的产品,而是原有产品在AI时代的更新换代,焕发出全新的体验和魅力。换句话说,今年的两大开发者大会,是去年的大会延续,是两大巨头根据去年确定的AI战略交出的成绩单,是无所不在的AI的应用体现。
▲Google Assistant
AI贯穿所有产品
昨天微软发布的Azure AI、IoT、Microsoft 365、Brainwave,今天谷歌更新的全家桶系列软件——Android P、Gmail、Google Photos、Google Assistant、Google News、Google Maps、Google Lens、自动驾驶,无一不是展示AI带来的更为人性化的体验,也是语音识别、图像识别、行为预测、自然语义理解这些深度学习相关技术在产品端的体现。

以今天的谷歌大会产品举例,Gmail可以预测性帮助用户写邮件,用户不需要一个词一个词的输入;Photos会自动识别面孔,给用户修图和自动文本转化;Assistant可以同时处理用户的两个指令,甚至直接后台给商家打电话预定;News可以自动搭建新闻专题,帮助用户了解热门事件的来龙去脉;Waymo的自动驾驶可以预判那些突发的意外情况,提前减速避开闯红灯突然横穿马路的行人车辆。具体的产品新功能介绍,可以看新浪科技的谷歌大会专题文章(请戳阅读原文)。

另一方面,人工智能产品需要用户数据。你只有完全相信谷歌,将自己的个人数据托付给谷歌,才能享受到Google Assitant、Gmail等所有AI相关产品的便利人性。获取用户数据的前提是隐私和安全;这也是微软和谷歌在两大主题演讲中高度强调的内容。

作为媒体从业者,我一直期待着人工智能技术可以解放媒体的工作效率。未来的新闻媒体工作,突发快讯、处理新闻稿、搭建专题这种繁琐耗时、低创造性的工作,都可以交给人工智能来完成。媒体人应该把宝贵的资源和精力,专注到原创内容和深度分析这些高创造性的工作上。

有一点需要向两大巨头致敬。谷歌和微软在推进前沿技术的同时,并没有忘记对残疾人弱势群体的关怀。昨天微软推出了2500万美元的五年计划"AI for Accessibility",联合开发者运用人工智能技术帮助残疾人改善生活体验;今天谷歌也专门推出了摩尔斯电码输入法,用机器学习技术帮助无法正常表达的残疾人与外界沟通。

微软每年都会在主题演讲抽出五分钟,专门介绍科技帮助残疾人的温情故事,前年是人工智能和智能眼镜帮助盲人“看到”世界,去年是智能手环帮助帕金森患者重新生活,今年则是人工智能帮助盲人学生跨越语言障碍。这些科技与人性的温情小故事不仅体现了对弱势群体的关怀,也是对科技巨头最好的品牌广告。
侧重2B与2C市场


话题回到两大巨头。微软和谷歌的两大开发者大会,实际上就是当前人工智能领域两大平台的开发者大会。但两大巨头的人工智能发力重点领域略有不同,微软主要瞄准的是2B的企业市场,而谷歌主导的则是2C的消费市场。

  

微软的AI产品,是深度整合到自己的Azure云平台和Windows平台上,包括了Azure AI和Windows ML。

此次Build大会重点强调的Azure AI,是意在向企业用户领域推广自己的“云+生产力+AI”的全套服务,主题演讲中的华为小米内嵌的智能翻译、大疆无人机为代表的升级版IoT都是微软AI在企业市场具体使用场景的体现。看得出来,微软迫切地希望打造一个基于自己云AI技术的企业市场生态圈。

在企业市场,微软AI的竞争对手主要包括亚马逊AWS和IBM的沃森。虽然在云服务领域,微软Azure市场份额依然落后于亚马逊的AWS,但微软也有自己拓展AI服务的独有优势——原先的生产力客户。微软的Windows和Office在全球大企业市场占据着主导地位。全球财富500强企业中,95%都在使用微软的云服务(包括了Azure和Office);Office 365的企业月活用户在去年10月就已经超过了1.2亿。

而谷歌的AI产品,也是完全融汇到自己的全套互联网服务和Android平台上。这些少则数亿、多则数十亿的海量用户基数,是谷歌发展AI最得天独厚的竞争优势,也是可以直接转化的消费市场用户。(Android月活设备去年就突破了20亿部,这不包括中国大陆市场。)

每一款经过AI“开光”的谷歌软件产品,比如谷歌今天发布的几乎全部应用,都能给谷歌带来更多的用户数据,满足深度学习的训练需求。

正因为如此,谷歌才从来不吝啬自己的平台,向iOS平台同步开放几乎每款AI软件产品。比起移动平台之争,谷歌更看重的是海量的iOS用户数据,甚至支付巨额费用向苹果iOS购买用户流量;Bernstein分析师预计,去年这部分流量购买费用高达30亿美元。

谷歌在消费市场的AI竞争对手,主要有亚马逊和Facebook。虽然在互联网服务用户基数上远不如谷歌,但亚马逊和Facebook各自在电商和社交领域占据无可撼动的主导优势。亚马逊的Alexa在智能家居和互动娱乐领域甚至还有自己的生态优势,这也是微软在消费AI领域选择让Cortana与亚马逊Alexa携手的重要原因。双方虽然在企业市场存在竞争,但在消费市场都面临着谷歌这个巨无霸一般的对手。
背后运算平台较量


AI战略之争,除了生态平台和用户数据之外,还有背后支撑AI运算和训练的云运算平台。这也是微软与谷歌开发者大会最吸引眼球的部分;昨天微软发布了深度学习加速平台Project Brainwave(去年发布预览版),今天谷歌发布的第三代TensorFlow芯片TPU 3.0。

值得一提的是,TPU 3.0处理器采用了液冷技术,运算能力比前一代产品提升了八倍。而微软的Brinwave的基石则是英特尔的Straix FPGA芯片。去年8月微软官方表示,使用英特尔Straitx 10 FPGA芯片,Brainwave不需要批处理就可以支持每秒39.5万亿次的运算。
▲谷歌推出人工智能专用芯片TPU3.0


微软从2012年开始,就已经将云与AI的芯片战略押注在更为灵活的FPGA芯片上。而这也是促使英特尔在2015年斥资167亿美元收购FPGA芯片巨头Altera的重要原因。过去几年,英特尔凭借着一系列数百亿美元的重大收购(Altera、Nervana、Movidius、Mobileye),为自己在AI时代卡住了一个重要身位。

微软在云端的深度学习平台是基于英特尔的FPGA芯片,在移动端的Windows ML平台也是基于英特尔的Movidius VPU芯片。虽然英特尔也曾宣布与Facebook合作打造AI芯片,但近期的系列迹象显示,Facebook正在组建自己的AI处理器研发团队。

相比之下,微软与英特尔在AI时代的利益绑定的更加紧密。微软在AI领域的拓展,也意味着英特尔AI芯片的拓展。从某种意义上说,微软与英特尔这对PC时代的黄金搭档,在AI时代又再度携手,共荣共进。

今年的三大开发者大会,还剩下6月份的苹果WWDC。苹果的AI战略基石显然是超过13亿的iOS用户以及相关的海量用户数据。去年苹果在WWDC上发布了Core ML机器学习框架,首次展示了自己在人工智能领域的规划。

由于苹果DNA高度强调数据安全和用户隐私的,使得苹果把自己的AI平台锁定在了移动设备本身,Core ML的机器学习都在iOS设备本地完成。这是一把双刃剑,虽然保证了数据安全,但也是一种运算能力的限制,对移动端芯片提出了更高的要求。

虽然微软和谷歌也有自己移动端的Windows ML和TensorFlow Light框架,但这并不是两大巨头的AI战略核心;他们的机器学习框架是和自己的云平台深度绑定。

面对微软和谷歌的云AI战略,苹果是否还会继续坚持机器学习的本地化?下个月就会见分晓。


    关注 新浪科技


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册