小豆科普:未来的核心技术——机器学习!

 

小豆今天要从科技界最活跃的谷歌说起,一起看看机器学习到底是什么,又对科技的未来意味着什么。...



2016年人工智能和机器人的热潮让人目不接暇,但只要留心,相信大家都会注意到所有的这些黑科技们,都在努力向一个关键词靠拢——机器学习

So,小豆今天就要从科技界最活跃的谷歌说起,一起看看机器学习到底对科技的未来意味着什么。



作为机器学习的一种,打败了李世石的AlphaGo让更多的人认识了「机器学习」。作为这项技术的头号粉丝,谷歌正锲而不舍地想要将机器学习融入自己的「中枢」。其实,AlphaGo的Deep Mind只是谷歌计划中微小的一部分,而以Carson Holgate为首的一批「算法忍者」可能才是未来真正的颠覆者。


今年26岁的Carson Holgate是谷歌Android部门的一名工程师,但她还有另一重身份:谷歌内部「机器学习忍者项目」(Machine Learning Ninja Program)中的一员。这个只有18个人的小团队,集结了谷歌各产品部门的精英,其目的就是为了让他们把学到的AI技术,融会贯通到自己当下所负责的产品中,以帮助它们变得「更加聪明」、「更加智能」。
「我们的口号是,你想成为机器学习忍者吗?」帮忙管理这个项目的谷歌机器学习团队的产品经理 Christine Robson 说 :「我们邀请谷歌的员工加入机器学习团队,与导师坐在一起,花6个月时间研究机器学习,同时做一些项目,并从项目实践中学习经验。」
多年来,机器学习被认为是一种只属于少数精英的学科。但现在这个时代结束了,最近的结果表明:由模仿生物大脑运作方式的神经网络驱动的机器学习,是赋予计算机以人类力量甚至超人力量的正确途径

事实上,CEO桑达尔·皮查伊此前就曾明确表态「机器学习是一种核心的转化式的改变」,而它改变的则是「我们做事的方式和思维」。这意味着谷歌已经从认知层面上发生了转变,一场自内而外的机器学习大潮已经开始。

那么,这个被谷歌重视到如此地步的机器学习到底是什么呢?
认识机器学习
机器学习的组成

机器学习系统由三个主要部分组成,包括:

▶ 模型:用来预测或识别的系统。

▶参数:模型做决定所使用的信号或因素。

▶学习器:这个系统通过检查预测和实际输出的差异来调整参数,再对模型进行调整。
想象你自己是一位老师,你想确认如果学生要在考试中取得好成绩,最优的学习时间会是多少?你向机器学习求助以便找到一个解决方案。
1
构造模型

一切都要从模型开始,机器学习用它来进行预测。至少在这个特定的例子中,系统最初的模型必须由人类提供:老师可以告诉机器学习模型进行这样的假设,即学习 5 个小时就可以取得好成绩。
2


提供最初的输入

现在模型已经确定了,需要输入实际的信息了。比如老师可能会输入不同学生的 4 个分数,以及他们学习的小时数。
3
学习器进行学习

这些输入机器学习系统的数据通常被称为「训练集」或者「训练数据」,因为系统中的学习器借助它们训练自己,以便生成一个更好的模型。
4
清洗并重复

现在输入一个新的分数集和时间,系统重新运行。这些实际的分数和学习部分修改后的模型做比较。如果成功,这些分数会很接近预测结果:
5


梯度下降法:如何避免机器学习失败

Google 的 Corrado 强调绝大多数的机器学习都是基于「梯度下降」或「梯度学习」的概念,也就是系统通过不断的微小调整直至得到正确的答案:「就像从一个很陡峭的山峰下来。你不会想要跳下来或者跑下来,那样太危险了。你很可能会不小心掉下去。事实上你会很小心得一点点挪下去。」
异想天开:

识别猫
上面的例子其实非常简单,但同样简单的系统可以用来做复杂的事情,比如识别猫的图片。

计算机不能像人类那样看东西。所以它们如何能够识别物体?就像 Google Photos 可以从我的照片中挑出很多物体一样:
机器学习可以做到这一点!还是同样的原理。你利用一些可能的因素构建了一个模型,这些因素可以帮助识别图像中的猫,比如颜色,形状等等。接下来你输入一个训练集,是一些有猫的图片,然后看这个模型工作的怎么样。学习器进行调整,重复训练的循环。但识别猫和其它物体是很困难的。

比如,最终系统是这样找到一只地毯上的猫:


这幅图事实上说明了,当计算机识别一只猫的时候,是在查找某种模式类型,而不是作为实际学习过程的一部分。

其实,从我们最初的例子发展到图像识别,模型已经不是人类而是机器创造出来的。它们自己尝试理解一个物体是什么,通过原始的颜色、形状和其他特性的组合来构建,然后利用训练数据进行优化。
机器学习的未来


正如 Peter Domingos 在机器学习领域非常受欢迎的《The Master Algorithm》一书中所写的,「机器学习是一项朝阳技术,是一种自我构建的技术。编写出这样一个系统你需要做如下工作:识别正确的数据,选择正确的算法,确保你构建了成功运行的正确条件,最后相信这个系统的工作能力(当然这对于程序员来说很困难)。」
《The Master Algorithm》一书封面




谷歌的机器学习团队领导者 Jeff Dean 估计现在在谷歌的 25000 名工程师中,只有几千人精通机器学习(或许是百分之十)。他希望这个比例接近百分之百。「如果每个工程师都至少有一些机器学习的知识就好了。」他说。
Jeff Dean : 谷歌权威计算机科学家




换而言之,谷歌内部已经开始贯彻「(技术)自我建造的同时也自我实现」这种思想,即所谓的「用机器学习取缔整个旧系统」。

机器学习既是一门科学,也是一门艺术,」Google Brain 的联合创建者Corrado 说,「就像做饭一样,虽然涉及到化学原理,但是要做一些真正有趣的事情,你必须要知道如何将面前的配料结合起来。」
Greg Corrado, Google Brain 的联合创建者, 与产品组一起工作将人工智能添进他们的软件中




所以,在一个机器学习正在占据舞台中心的世界里,以人工智能为中心的谷歌有维持自己主导地位的计划,而之前提到的 Carson Holgate 和她的忍者课程内容正是以这个计划为中心的。她已经不可能回头了,因为她知道这些人工智能技术就在这里,而且是谷歌的未来,也许是所有技术的未来,或者所有事物的未来
Carson Holgate,谷歌工程师,机器学习忍者训练中

小豆惊觉,当我们还在探讨人工智能的合理性,其实谷歌早已集结自己的精英军团,开始将人类的智慧与电脑的智慧相结合——而机器学习正是将这一切实现的核心武器。

就像谷歌正在做的那样,在未来,专攻机器学习的工程师将是科技世界急需的宝贵人才。会编程的工程师很多,但要如何培养出众多能够教会机器自主学习的工程师,也将成为各界面临的一大问题:毕竟谷歌的忍者课程目前要大面积推广并不算现实。

不过,时间还很充裕,小豆的建议是: 要着眼未来,还是先从眼前做起比较好——最起码,让我们的孩子从现在就开始接触机器人和编程吧!事实是,越早打好基础,机器学习的概念也将越早被这些未来的工程师们掌握。
那么,如何让孩子尽早编程启蒙?

还用说吗?
持续关注「豆姆Lab」,了解

众多孩子是怎样在和机器人玩耍

的过程中学习搭建和编程的~

而且你也有机会喔!



    关注 豆姆Lab


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册