小豆科普：未来的核心技术——机器学习！

小豆今天要从科技界最活跃的谷歌说起，一起看看机器学习到底是什么，又对科技的未来意味着什么。...

2016年人工智能和机器人的热潮让人目不接暇，但只要留心，相信大家都会注意到所有的这些黑科技们，都在努力向一个关键词靠拢——机器学习。

So，小豆今天就要从科技界最活跃的谷歌说起，一起看看机器学习到底对科技的未来意味着什么。

作为机器学习的一种，打败了李世石的AlphaGo让更多的人认识了「机器学习」。作为这项技术的头号粉丝，谷歌正锲而不舍地想要将机器学习融入自己的「中枢」。其实，AlphaGo的Deep Mind只是谷歌计划中微小的一部分，而以Carson Holgate为首的一批「算法忍者」可能才是未来真正的颠覆者。

今年26岁的Carson Holgate是谷歌Android部门的一名工程师，但她还有另一重身份：谷歌内部「机器学习忍者项目」（Machine Learning Ninja Program）中的一员。这个只有18个人的小团队，集结了谷歌各产品部门的精英，其目的就是为了让他们把学到的AI技术，融会贯通到自己当下所负责的产品中，以帮助它们变得「更加聪明」、「更加智能」。

「我们的口号是，你想成为机器学习忍者吗？」帮忙管理这个项目的谷歌机器学习团队的产品经理 Christine Robson 说：「我们邀请谷歌的员工加入机器学习团队，与导师坐在一起，花6个月时间研究机器学习，同时做一些项目，并从项目实践中学习经验。」

多年来，机器学习被认为是一种只属于少数精英的学科。但现在这个时代结束了，最近的结果表明：由模仿生物大脑运作方式的神经网络驱动的机器学习，是赋予计算机以人类力量甚至超人力量的正确途径。

事实上，CEO桑达尔·皮查伊此前就曾明确表态「机器学习是一种核心的转化式的改变」，而它改变的则是「我们做事的方式和思维」。这意味着谷歌已经从认知层面上发生了转变，一场自内而外的机器学习大潮已经开始。

那么，这个被谷歌重视到如此地步的机器学习到底是什么呢？

认识机器学习

机器学习的组成

机器学习系统由三个主要部分组成，包括：

▶ 模型：用来预测或识别的系统。

▶参数：模型做决定所使用的信号或因素。

▶学习器：这个系统通过检查预测和实际输出的差异来调整参数，再对模型进行调整。

想象你自己是一位老师，你想确认如果学生要在考试中取得好成绩，最优的学习时间会是多少？你向机器学习求助以便找到一个解决方案。

1

构造模型

一切都要从模型开始，机器学习用它来进行预测。至少在这个特定的例子中，系统最初的模型必须由人类提供：老师可以告诉机器学习模型进行这样的假设，即学习 5 个小时就可以取得好成绩。

2

提供最初的输入

现在模型已经确定了，需要输入实际的信息了。比如老师可能会输入不同学生的 4 个分数，以及他们学习的小时数。

3

学习器进行学习

这些输入机器学习系统的数据通常被称为「训练集」或者「训练数据」，因为系统中的学习器借助它们训练自己，以便生成一个更好的模型。

4

清洗并重复

现在输入一个新的分数集和时间，系统重新运行。这些实际的分数和学习部分修改后的模型做比较。如果成功，这些分数会很接近预测结果：

5

梯度下降法：如何避免机器学习失败

Google 的 Corrado 强调绝大多数的机器学习都是基于「梯度下降」或「梯度学习」的概念，也就是系统通过不断的微小调整直至得到正确的答案：「就像从一个很陡峭的山峰下来。你不会想要跳下来或者跑下来，那样太危险了。你很可能会不小心掉下去。事实上你会很小心得一点点挪下去。」

异想天开：

识别猫

上面的例子其实非常简单，但同样简单的系统可以用来做复杂的事情，比如识别猫的图片。

计算机不能像人类那样看东西。所以它们如何能够识别物体？就像 Google Photos 可以从我的照片中挑出很多物体一样：

机器学习可以做到这一点！还是同样的原理。你利用一些可能的因素构建了一个模型，这些因素可以帮助识别图像中的猫，比如颜色，形状等等。接下来你输入一个训练集，是一些有猫的图片，然后看这个模型工作的怎么样。学习器进行调整，重复训练的循环。但识别猫和其它物体是很困难的。

比如，最终系统是这样找到一只地毯上的猫：

这幅图事实上说明了，当计算机识别一只猫的时候，是在查找某种模式类型，而不是作为实际学习过程的一部分。

其实，从我们最初的例子发展到图像识别，模型已经不是人类而是机器创造出来的。它们自己尝试理解一个物体是什么，通过原始的颜色、形状和其他特性的组合来构建，然后利用训练数据进行优化。

机器学习的未来

正如 Peter Domingos 在机器学习领域非常受欢迎的《The Master Algorithm》一书中所写的，「机器学习是一项朝阳技术，是一种自我构建的技术。编写出这样一个系统你需要做如下工作：识别正确的数据，选择正确的算法，确保你构建了成功运行的正确条件，最后相信这个系统的工作能力（当然这对于程序员来说很困难）。」

《The Master Algorithm》一书封面

谷歌的机器学习团队领导者 Jeff Dean 估计现在在谷歌的 25000 名工程师中，只有几千人精通机器学习（或许是百分之十）。他希望这个比例接近百分之百。「如果每个工程师都至少有一些机器学习的知识就好了。」他说。

Jeff Dean : 谷歌权威计算机科学家

换而言之，谷歌内部已经开始贯彻「（技术）自我建造的同时也自我实现」这种思想，即所谓的「用机器学习取缔整个旧系统」。

「机器学习既是一门科学，也是一门艺术，」Google Brain 的联合创建者Corrado 说，「就像做饭一样，虽然涉及到化学原理，但是要做一些真正有趣的事情，你必须要知道如何将面前的配料结合起来。」

Greg Corrado, Google Brain 的联合创建者，与产品组一起工作将人工智能添进他们的软件中

所以，在一个机器学习正在占据舞台中心的世界里，以人工智能为中心的谷歌有维持自己主导地位的计划，而之前提到的 Carson Holgate 和她的忍者课程内容正是以这个计划为中心的。她已经不可能回头了，因为她知道这些人工智能技术就在这里，而且是谷歌的未来，也许是所有技术的未来，或者所有事物的未来。

Carson Holgate，谷歌工程师，机器学习忍者训练中

小豆惊觉，当我们还在探讨人工智能的合理性，其实谷歌早已集结自己的精英军团，开始将人类的智慧与电脑的智慧相结合——而机器学习正是将这一切实现的核心武器。

就像谷歌正在做的那样，在未来，专攻机器学习的工程师将是科技世界急需的宝贵人才。会编程的工程师很多，但要如何培养出众多能够教会机器自主学习的工程师，也将成为各界面临的一大问题：毕竟谷歌的忍者课程目前要大面积推广并不算现实。

不过，时间还很充裕，小豆的建议是：要着眼未来，还是先从眼前做起比较好——最起码，让我们的孩子从现在就开始接触机器人和编程吧！事实是，越早打好基础，机器学习的概念也将越早被这些未来的工程师们掌握。