大千世界的数据方法论韦编N绝

 

上班日,我爱热爱工作的自己;休息日,我爱热爱读书的自己。...



关键词:  西格兰  集体智慧编程

韦编N绝

上班日,

我爱热爱工作的自己;

休息日,

我爱热爱读书的自己。

南斗智库

这里是南斗智库“韦编N绝”——青年人的读书交流平台。
时间:2017年1月21日
受访人:王浩帆,宅男一枚,偶尔从事产品开发。
南斗智库:您最近读的一本书是什么?

王浩帆: 《集体智慧编程》

南斗智库:您每天会在什么时间读这本书呢?

王浩帆: 基本是坐在电脑前不想干活的时候
南斗智库: 这本书大概讲的是什么内容呢?

王浩帆: 机器学习,一些耳熟能详的算法,如聚类、模拟退火、遗传、贝叶斯、决策树、支持向量机等等,都会涉及。全书没有出现数学公式或是原理讲解,而是通过实际的应用案例并且展示实现代码的方式可以让一个对此领域陌生的人迅速掌握一定应用技能,了解如何能够从信息世界杂乱无章的数据中挖掘有用的信息。
南斗智库:您会反复阅读这本书吗?

王浩帆: 会,每当技能提升到新的层次时都会拿出这本书来一边看作者的实现方法一边挑错或挑能优化的部分。(对,我就是来找抽的)

南斗智库:您和这本书是怎么“相遇”的呢?

王浩帆: 朋友推荐
《集体智慧编程》


南斗智库: 书的封面是吸引人的吗?

王浩帆: 不,这个封面糟透了。如果不是带着编程两字,一般人可能会觉得是一本讲述生命科学的书。不知道各位对于生命科学的热忱在学完高中生物之后还剩多少。
南斗智库: 看书的时候会想起自己的某段经历吗?

王浩帆: 对于我这样一个每日劳作准时搬砖的人,这本书就是一个工具书,看书时能想起基本的都是些抓狂的日夜(笑)。

分享一个比较轻松愉快的经历吧,那是在14年6月,刚刚看过这本书的第五章时,了解作者利用成本函数优化组团乘坐交通工具的实践后感到醍醐灌顶、脑洞大开,想借鉴作者思路来给自己去大同游玩的旅程添加一些科技味。
我录入了期望去探索的景点的路途和时间花费信息以及总共可以游玩的时间,让电脑帮我推荐一组最佳路线出来。电脑很卖力的推荐了数个组合,于是我最后决定在网上借鉴别人的攻略。
南斗智库: 您可以完全理解作者的情绪或者态度吗?有什么不理解的地方想要与其他读者讨论的吗?

王浩帆: 作者在写这本书时可能是希望尽可能的简单化专业内容,毕竟不是所有人都需要成为数据科学家,所以不会都愿意花费大把时间理解繁杂的数学公式,只需要理解如何应用即可。但从我个人观点来看,这恰恰是这本书的瓶颈所在。在计算机领域,实现一个功能的方法比最终代码更加珍贵,数学公式是算法的精髓,所以如果这本书能够勾起读者对算法的兴趣,建议还是找来专业的读物、论文进行深入研究。当然,这只是个人的理解,欢迎其他人来拍砖。
南斗智库: 您认为什么年龄段的人最能够理解这本书?

王浩帆: 既然是专业书籍,知识储备可能会比年龄更加适合用于衡量。有高中水平的数学知识和少量的计算机编程基础即可看懂大部分方法和代码,所以17岁以上的人理解起来比较容易,比较有天赋的小孩子们读读也无妨,总好过天天玩手机(笑)。
南斗智库: 可以摘录几段您认为很有共鸣或很精彩的内容吗?

王浩帆: 这书里能摘出来的基本除了方法就是代码,显然不是这个问题所希望得到的(笑),我从编者的前言中摘一段吧。
“无论是有意还是无意,越来越多投身于互联网的人们已经制造出了相当多的数据,这给了我们无数潜在的机会来洞悉用户体验、商业营销、个人偏好和通常所谓的人类行为(human behavior)。本书向大家介绍了一个新兴的领域,称为聚集型智慧(collective intelligence)。这一领域涵盖了诸多方法,借助这些方法我们可以从众多Web站点处(这些站点的名字或许你曾经有所耳闻)提取到值得关注的重要数据;借助这些方法我们还可以从使用自己应用程序的用户那里搜集信息,并对我们所掌握的数据进行分析和理解。”
韦编N绝·往期
白夜行  |  繁花  |  文学回忆录

2016  TOP 10

轻一点儿  |  风之影  |  激荡三十年  |  大剑  |  无人生还

因为痛,所以叫婚姻  |  我脑袋里的怪东西

岛上书店  |  青之炎  |  活着  |  苦妓回忆录

从你的全世界路过  |  了不起的盖茨比

解忧杂货店  |  华莱士人鱼


(受访人:王浩帆;文章来源:南斗智库;采访人:火马;编辑:火马)



南斗智库

微信号:NandouInstitute

官方网站:www.nandou.org

“小机构,大网络”


    关注 南斗智库


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册