式说新语 深度学习强化学习监督式学习都是什么鬼
歪?警察叔叔吗?我的智商被偷了.......
· 式说新语 ·
· 式说新语 ·
Hi哎喂扒第,在一群大魔王的温暖呵护(冷酷蹂躏)下,小式又欢欣鼓舞(生不如死)地度过了一周。每次交锋,小式都毫不费力地刷新了大魔王们对我无知程度的认识。最近,魔王们常常露出一脸慈爱的表情,并把这种“纯粹严肃的学术探讨”定义为“IQ探底游戏”。以下,根据上周“你最想看什么料”的投票结果,为大家奉上小式PK魔王001之ROUND2”:魔王001说,我所说的这些概念都是机器学习的基本概念,所以他给我推荐了这本书:式说新语是第四范式面向公众的AI(人工智能)科普小栏目。
在这里,小式科普AI知识,也安利范式八卦。
· 式说新语 ·
深度学习:换了马甲的神经网络
“有老师教”的监督式学习
“自学成才”的学霸-非监督式学习
那什么是半监督式学习呢?就是其训练的数据一部分是有参考答案的,一部分是没有的。为什么会这样呢?因为隐藏在半监督学习下的基本规律在于:数据的分布必然不是完全随机的,通过一些有标签数据的局部特征,以及更多没标签数据的整体分布,就可以得到相对更好的分类结果。
举个例子,判断我司谁是大魔王?如果只有我(女生)和三个大魔王(都是男生),那么监督式学习依据已知的性别标签,很可能把判断大魔王标准定为:男生是大魔王。但是如果我又叫了二十个人过来,而不给任何可以参考的标签,就可以分析出更多大魔王的相似特征:如高智很商,能力极强,行业大牛等等。
吃一堑长一智的强化学习
维基:强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。再看百度:所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。不知道你们,反正小式看完就是“债见”的感觉。还好,经过大魔王点化,小式终于明白,强化学习就好比不给机器任何指导,让它在一个迷宫里自己走动,如果碰壁了,就pass掉这条路,如果最后找到了出口,就记下这个正确的路子。
说白了,强化学习就是个吃一堑长一智的过程。但因为强化学习强调的是取得最大化的回报,所以这里的吃一堑长一智基于的不是一个当下的反馈,而是基于全局的一个整体回报。拿阿法狗举例,强化学习不是立刻告诉阿法狗当下走的这一步棋好不好,而是追求一整盘棋下得好不好。
呼,终于讲完啦,了解更多AI芝士,翻到最后扫码关注“第四范式”。
各位看倌该点赞点赞该转发转发,不然,我要关门放我家大魔王们出来啦!
关于第四范式
第四范式是国际领先的人工智能技术与服务提供商。第四范式团队兼具全球最顶尖的科技前沿和业界实战经验,拥有国际顶尖的理论背景,极致的工匠精神和对行业的深度理解,致力于“从需求出发”、“以业务增值为导向”,为企业找到下一个业绩增长点,建立新的发展模式,并实现基于人工智能的行业应用。
第四范式是国际领先的人工智能技术与服务提供商。第四范式团队兼具全球最顶尖的科技前沿和业界实战经验,拥有国际顶尖的理论背景,极致的工匠精神和对行业的深度理解,致力于“从需求出发”、“以业务增值为导向”,为企业找到下一个业绩增长点,建立新的发展模式,并实现基于人工智能的行业应用。
We Think You Different
我秉匠心 你乘独运
扫描下面二维码 欢迎关注“第四范式”
关注 第四范式
微信扫一扫关注公众号