一文看全2018 Google I/O大会：AI逐渐人性化巨头未来也靠它_【新浪科技】

面对微软和谷歌的云AI战略，苹果是否还会继续坚持机器学习的本地化？下个月就会见分晓。...

新浪科技

科技观潮，与浪前行

关注

文|新浪科技郭晓光郑峻

5月9日凌晨，为期三天的Google I/O开发者大会在美国开幕。在刚刚结束的主题演讲上，谷歌CEO桑达尔-皮查伊（Sundar Pichai）和各产品线负责人讲解了自家的AI、Android系统、谷歌助手等产品的进展。

今年的主角依然是AI人工智能，它已经融入谷歌产品与软件系统中，但这次，谷歌在讲解AI或产品功能时从理解人类和人性的角度举例，把AI带到了科技与人文的十字路口上。

AI：贴近人性并对人类有帮助

谷歌CEO皮查伊用两个卡通图标举例作为开场白，说明谷歌对信息真实的追求。AI是第一个被提及的话题，皮查伊将之具体到医疗领域，用视网膜扫描诊断疾病的具体案例来解释机器学习的能力，让观众能理解AI对人类的作用——“医疗就是AI能改变的重要领域”。

▲AI帮助判断眼部病情

以往在Google I/O上大谈代码只有码农们兴奋而旁人无感的状况终于有所改进，皮查伊将每个技术点都具体化，例如谷歌相册中找到朋友的婚礼照片，下面会提示是不是要分享给她；或是一张较昏暗的照片提示用户要不要调整。

▲AI应用实例，看到某人照片，手机问要不要分享给她

另外，谷歌公布了自己的人工智能专用芯片TPU3.0，相比上代，它使用液冷，计算力是去年TPU2.0的8倍，可以更快更智能地解决更多问题。但这部分只有两句，并未过多解释。

▲支持水冷的智能芯片

Google Assistant：连声音都更像人类

Google Assistant（谷歌助手）是本次开发者大会介绍的第二个重要新品，它是谷歌的AI智能助手，这次更新带来6种新声音，并且发音更贴近人类自然语言，不那么像机器人发出来的声音。

皮查伊介绍说它的声调、节奏等都更接近人类。他们在录音室里采集了人类的声音，捕捉声音特质，之后分析特征融入Google Assistant中。

▲谷歌助手的语音更自然

谷歌宣布了自己的AI语音助手发布2年后，已经支持30种语音，在80个国家可用；一些细节改变还有：

1）持续性对话，不用每次都喊Hey Google唤醒一次才问一个问题，它可以连续回答；

2）家庭使用场景，例如孩子跟谷歌助手对话的时候，如果他比较礼貌地说“请”字，谷歌助手也会给出更nice的回答——谷歌希望用这种不为人注意的细节，来告诉用户自己的AI助手有多周到。

▲谷歌助手不仅是个语音助手，还对带屏幕的设备进行了优化

除了声音，谷歌助手在视觉表达方面也有所改进。现场采用中国公司联想的“智能显示器”来展示谷歌助手在视觉方面给人们的反馈，还有手机上的语音搜索展示；在开车时候，如果用声音控制，谷歌助手也会融合在谷歌地图上，给人类声音+视觉展示，把导航这件事做得更好。

皮查伊演示了两个极为科幻的场景：

你要理发，喊谷歌助手预定，它会给理发店打电话，并回答出理发店里店员“几点理发”“预定客人的名字”等信息；

或者预定餐馆，如果没位置，它也能学会变通更改预定时间——全程是谷歌助手（机器）在和一个人类流畅的对话，它的声音仿佛一个人类，回答方式也是一个人类，没有机械刻板的痕迹。

▲机器和人类对话约理发，极其科幻的场景

预约理发和餐馆这两个场景非常生活化，这么自然的场景，你手机里的智能助手就能独立完成。谷歌告诉世人，他们真的把自己的智能助理变成了人，并在自己的发布会上演出了科幻片里的情节。

▲谷歌助手与人类对话：预约理发和餐厅

虽然我们相信实际生活中不会像舞台演示这么流畅，但谷歌助手已经展示了目前AI助手的发展方向，就是朝着人类的方向进化。

Google News：AI做新闻

谷歌自己不是媒体不做新闻，但他们的Google News用AI介入了人们阅读新闻方式，第一个特征可以粗略理解为高端版“今日头条”，它的有些方式很像关联阅读，你看了条朝鲜韩国领导人见面的新闻，它会关联推送其他相关新闻。

▲学习用户读新闻习惯，自动生成一个专题

第二个特征，360度报道，让用户了解整个新闻的来龙去脉。比如某地停电，在新闻前后有这件事本身、人们需要做什么，以前以后相关的事件。他们想让用户知道一件事，并在后台绘制出一张脉络图，让用户完整理解这件事——这基本等于机器自己搭建了一个专题。

▲相关阅读推荐

第三个特征是让用户订阅自己需要的媒体，目前Google News已经进入127个国家和地区，在Android和iOS上都能找到。

Android P：帮用户戒掉手机瘾

十年前，谷歌发布了搭载Android系统的首款手机G1，影响了智能手机的变化。如今的Android系统没有大幅变化，一切尽在细节中：

加入了更多的智能体现，例如根据用户习惯判别使用情况来节省电力；

根据用户喜好（手机亮度跳到了多高等）来自动判别亮度，让用户大幅降低手动调整亮度的机会，号称准确率到了60%；

应用预测，学习用户习惯和使用情景，来给用户提供有效的App建议。

▲学习用户习惯来省电

在界面方面，Android系统的界面变得更简单，并加入了更多手势。在这点上，谷歌似乎借鉴了iPhone X的手势（或者说他们都借鉴了webOS），在现场演示的Pixel手机上，底部有个小横条，滑动返回桌面，或是切换App，跟iPhone X实现方式接近。

▲底部滑动条像iPhone X

谷歌希望Android P能帮人了解自己用手机做什么，防止沉迷在数字世界里。比如现在每个App都能统计使用时间，看看你究竟用手机做什么；到睡觉时间提醒人类并把手机屏幕调成灰色——帮用户戒掉手机瘾。

今天Android P Beta测试版已经上线，在谷歌提到的适配手机厂商中大半来自中国：一加，小米，ov与索尼诺基亚等国际厂商放在一起，成为了第一批支持厂商。

▲第一批适配厂商中大半来自中国

Google Maps+Google Lens：兴趣推荐

谷歌给地图加了更丰富的地点相关概念，利用AI和卫星图像技术，可以了解新地址和商家，另外推荐最近的路程和附近最适合你的餐厅。其实类似功能目前高德，百度地图等也有尝试。

▲地图相关推荐不是新功能了

谷歌地图这次跟手机摄像头结合了，例如你不知道在哪，打开镜头，它会采集街头画面，之后将实景与地图结合，告诉用户该向哪走。

▲AR实景导航

这个功能其实是Google Lens与地图的融合，它是一款基于图像识别和OCR技术的人工智能应用，这次被用在地图这种实用场景里；另外Google Lens本身也得到了加强，例如拍一张纸，上面的字可以识别并从纸上“粘贴”到手机里。

▲从现实“粘贴”到电子世界

无人驾驶：车自己预判路况

2016年，谷歌的母公司Alphabet宣布将自动驾驶汽车项目分拆为一家单独的公司Waymo，这次的无人驾驶汽车和部分就由Waymo的CEO John Krafcik上台讲解，他介绍了Waymo无人驾驶汽车的近况：已在亚利桑那州凤凰城上路，AI的介入让无人驾驶的错误已经减少了100多倍，可让无人驾驶汽车更安全。

▲Waymo无人驾驶汽车

目前Waymo有2.5万辆车每天在路上验证各种路况。Waymo的讲解人举了个例子来说明神经网络的学习结果：无人车可以自己预测人们或车在横穿马路、闯红灯等行为提前预判，防止在过十字路口时撞到闯红灯人或车。

▲AI预判路上行为

给AI加上人性

这是一场名副其实的开发者大会，没有硬件发布，也似乎没有一种系统是大革命性更新。这其实已经不是第一年这样了——AI的介入，让每件产品都有了机器学习的属性，更新在了潜移默化中。

相比之下，UI界面改头换面这种表层的惊喜少了，所有的改进似乎都是细枝末节。智能化的演进在每分每秒进行，根据用户使用习惯而悄悄变化。

对比之前，这场主题演讲特殊之处就是无时不忘提到AI对人类的帮助，以及AI资深的人性化（比如教小朋友说”请“），理工男们用这种方式让外界理解自己打造一个“更美好世界”的梦想，这也是硅谷所有科技公司的态度，不同的是，这个目的是AI帮助人类实现的。

AI时代已经到来

颇具戏剧性的是，微软Build开发者大会和谷歌I/O开发者大会今年撞车了，开幕时间只差一天。微软在西雅图，本月7日到9日；谷歌在山景城，本月8日到10日。开发者群体或许各有侧重，但科技媒体就不得不兵分两路。

这两大科技巨头存在着不少业务重合与竞争，正好也是PC时代和后PC时代的两大代表性公司，目前则分别拥有全球最大的桌面和移动操作系统。在PC时代，微软和英特尔的Wintel组合横扫市场；而在后PC时代，谷歌和苹果分割统治了移动平台。

无论是昨天的微软Build大会，抑或是今天的谷歌I/O大会，有着一个共同的主题词——人工智能。AI几乎无处不在，贯穿着两大巨头诸多纷繁复杂的新产品，重新定义了软件服务的体验。毫无疑问，科技行业正在迈进了全新的AI时代。

实际上，谷歌和微软去年就已将AI定义为自己的未来战略。无论是微软CEO所说的“AI重新定义一切”(AI Redefine All)，还是谷歌CEO提出的“移动优先转向AI优先”(Mobile First to AI First)，两位印度裔CEO的战略实际上同出一源：AI会成为贯穿两位巨人的血液，渗透和提升微软与谷歌的所有产品和业务之中。

从这个角度来看，今年的微软和谷歌I/O大会并没有太多全新的产品，而是原有产品在AI时代的更新换代，焕发出全新的体验和魅力。换句话说，今年的两大开发者大会，是去年的大会延续，是两大巨头根据去年确定的AI战略交出的成绩单，是无所不在的AI的应用体现。

▲Google Assistant

AI贯穿所有产品

昨天微软发布的Azure AI、IoT、Microsoft 365、Brainwave，今天谷歌更新的全家桶系列软件——Android P、Gmail、Google Photos、Google Assistant、Google News、Google Maps、Google Lens、自动驾驶，无一不是展示AI带来的更为人性化的体验，也是语音识别、图像识别、行为预测、自然语义理解这些深度学习相关技术在产品端的体现。

以今天的谷歌大会产品举例，Gmail可以预测性帮助用户写邮件，用户不需要一个词一个词的输入；Photos会自动识别面孔，给用户修图和自动文本转化；Assistant可以同时处理用户的两个指令，甚至直接后台给商家打电话预定；News可以自动搭建新闻专题，帮助用户了解热门事件的来龙去脉；Waymo的自动驾驶可以预判那些突发的意外情况，提前减速避开闯红灯突然横穿马路的行人车辆。具体的产品新功能介绍，可以看新浪科技的谷歌大会专题文章（请戳阅读原文）。

另一方面，人工智能产品需要用户数据。你只有完全相信谷歌，将自己的个人数据托付给谷歌，才能享受到Google Assitant、Gmail等所有AI相关产品的便利人性。获取用户数据的前提是隐私和安全；这也是微软和谷歌在两大主题演讲中高度强调的内容。

作为媒体从业者，我一直期待着人工智能技术可以解放媒体的工作效率。未来的新闻媒体工作，突发快讯、处理新闻稿、搭建专题这种繁琐耗时、低创造性的工作，都可以交给人工智能来完成。媒体人应该把宝贵的资源和精力，专注到原创内容和深度分析这些高创造性的工作上。

有一点需要向两大巨头致敬。谷歌和微软在推进前沿技术的同时，并没有忘记对残疾人弱势群体的关怀。昨天微软推出了2500万美元的五年计划"AI for Accessibility"，联合开发者运用人工智能技术帮助残疾人改善生活体验；今天谷歌也专门推出了摩尔斯电码输入法，用机器学习技术帮助无法正常表达的残疾人与外界沟通。

微软每年都会在主题演讲抽出五分钟，专门介绍科技帮助残疾人的温情故事，前年是人工智能和智能眼镜帮助盲人“看到”世界，去年是智能手环帮助帕金森患者重新生活，今年则是人工智能帮助盲人学生跨越语言障碍。这些科技与人性的温情小故事不仅体现了对弱势群体的关怀，也是对科技巨头最好的品牌广告。

侧重2B与2C市场

话题回到两大巨头。微软和谷歌的两大开发者大会，实际上就是当前人工智能领域两大平台的开发者大会。但两大巨头的人工智能发力重点领域略有不同，微软主要瞄准的是2B的企业市场，而谷歌主导的则是2C的消费市场。

　　

微软的AI产品，是深度整合到自己的Azure云平台和Windows平台上，包括了Azure AI和Windows ML。

此次Build大会重点强调的Azure AI，是意在向企业用户领域推广自己的“云+生产力+AI”的全套服务，主题演讲中的华为小米内嵌的智能翻译、大疆无人机为代表的升级版IoT都是微软AI在企业市场具体使用场景的体现。看得出来，微软迫切地希望打造一个基于自己云AI技术的企业市场生态圈。

在企业市场，微软AI的竞争对手主要包括亚马逊AWS和IBM的沃森。虽然在云服务领域，微软Azure市场份额依然落后于亚马逊的AWS，但微软也有自己拓展AI服务的独有优势——原先的生产力客户。微软的Windows和Office在全球大企业市场占据着主导地位。全球财富500强企业中，95%都在使用微软的云服务(包括了Azure和Office)；Office 365的企业月活用户在去年10月就已经超过了1.2亿。

而谷歌的AI产品，也是完全融汇到自己的全套互联网服务和Android平台上。这些少则数亿、多则数十亿的海量用户基数，是谷歌发展AI最得天独厚的竞争优势，也是可以直接转化的消费市场用户。(Android月活设备去年就突破了20亿部，这不包括中国大陆市场。)

每一款经过AI“开光”的谷歌软件产品，比如谷歌今天发布的几乎全部应用，都能给谷歌带来更多的用户数据，满足深度学习的训练需求。

正因为如此，谷歌才从来不吝啬自己的平台，向iOS平台同步开放几乎每款AI软件产品。比起移动平台之争，谷歌更看重的是海量的iOS用户数据，甚至支付巨额费用向苹果iOS购买用户流量；Bernstein分析师预计，去年这部分流量购买费用高达30亿美元。

谷歌在消费市场的AI竞争对手，主要有亚马逊和Facebook。虽然在互联网服务用户基数上远不如谷歌，但亚马逊和Facebook各自在电商和社交领域占据无可撼动的主导优势。亚马逊的Alexa在智能家居和互动娱乐领域甚至还有自己的生态优势，这也是微软在消费AI领域选择让Cortana与亚马逊Alexa携手的重要原因。双方虽然在企业市场存在竞争，但在消费市场都面临着谷歌这个巨无霸一般的对手。

背后运算平台较量

AI战略之争，除了生态平台和用户数据之外，还有背后支撑AI运算和训练的云运算平台。这也是微软与谷歌开发者大会最吸引眼球的部分；昨天微软发布了深度学习加速平台Project Brainwave(去年发布预览版)，今天谷歌发布的第三代TensorFlow芯片TPU 3.0。

值得一提的是，TPU 3.0处理器采用了液冷技术，运算能力比前一代产品提升了八倍。而微软的Brinwave的基石则是英特尔的Straix FPGA芯片。去年8月微软官方表示，使用英特尔Straitx 10 FPGA芯片，Brainwave不需要批处理就可以支持每秒39.5万亿次的运算。

▲谷歌推出人工智能专用芯片TPU3.0

微软从2012年开始，就已经将云与AI的芯片战略押注在更为灵活的FPGA芯片上。而这也是促使英特尔在2015年斥资167亿美元收购FPGA芯片巨头Altera的重要原因。过去几年，英特尔凭借着一系列数百亿美元的重大收购(Altera、Nervana、Movidius、Mobileye)，为自己在AI时代卡住了一个重要身位。

微软在云端的深度学习平台是基于英特尔的FPGA芯片，在移动端的Windows ML平台也是基于英特尔的Movidius VPU芯片。虽然英特尔也曾宣布与Facebook合作打造AI芯片，但近期的系列迹象显示，Facebook正在组建自己的AI处理器研发团队。

相比之下，微软与英特尔在AI时代的利益绑定的更加紧密。微软在AI领域的拓展，也意味着英特尔AI芯片的拓展。从某种意义上说，微软与英特尔这对PC时代的黄金搭档，在AI时代又再度携手，共荣共进。

今年的三大开发者大会，还剩下6月份的苹果WWDC。苹果的AI战略基石显然是超过13亿的iOS用户以及相关的海量用户数据。去年苹果在WWDC上发布了Core ML机器学习框架，首次展示了自己在人工智能领域的规划。

由于苹果DNA高度强调数据安全和用户隐私的，使得苹果把自己的AI平台锁定在了移动设备本身，Core ML的机器学习都在iOS设备本地完成。这是一把双刃剑，虽然保证了数据安全，但也是一种运算能力的限制，对移动端芯片提出了更高的要求。

虽然微软和谷歌也有自己移动端的Windows ML和TensorFlow Light框架，但这并不是两大巨头的AI战略核心；他们的机器学习框架是和自己的云平台深度绑定。

面对微软和谷歌的云AI战略，苹果是否还会继续坚持机器学习的本地化？下个月就会见分晓。