这些数据科学小tips只有老司机才知道

 

译自Quora:有哪些事是数据专家了解但数据初学者却不知道的? What do experienced data scientists know that beginner data scientists donx26#39;t know?...


我  相  信  这  么  优秀  的  你 
 已  经  置 顶  了  我


翻译|钟国敬 选文|小象

转载请联系后台



Q:有哪些事是有经验的数据专家了解但数据初学者却不知道的?
回答者#1  I-Kang Ding
来自capital one labs的数据专家


其实,我称不上是一个“有经验的数据专家”,只是比几年前更有经验而已。以下是我对这个问题的一些看法。

1、别人不会关心你实现的过程只会关注你最后的结果:在大多数情况下,你的商业伙伴不会真的在意你是怎样完成这件事的。你真正要做的是提炼出你解决事情的本质然后站在非专业人士角度向他们解释这个事情。
↓我刚刚写出了一生中最美的代码↓


他们随手交给我一个难以解决的任务。我在48小时之内写了200行代码解决了它。

学术角度:我的天哪,这意味着要用六页纸,一到两个论点外加教材上的一段长篇大论。

商业角度:你解决了这个问题,很棒!既然你解决了它,你能给出我们新手机的外观图吗?



2、善待未来的自己另一方面,那些聘用或解雇你的人是很在意你是如何完成一件事的。通常,这些人对你未来的发展有着十分重要的作用。所以一定要为未来的发展积累资源。
↓你是谁, denvercode9? 你看到了什么?↓


我从来都没有和另一个灵魂产生共鸣的感觉,一只觉得十分孤独和无助。尤其在我希望在谷歌上找到解决问题的答案时找到另一个提出相同问题的人,却发现最后的回复是在2003年。



3、“人们经常不了解他们真正想要的是什么”
“很多人,不等到你把他们想要的东西拿给他们看,他们都不知道自己想要什么”。——乔布斯
好吧,事情也没有乔布斯说的那么极端,但是你必须能够从海量的信息中提炼出有用的信息给你的合作伙伴。你的合作伙伴们经常会问一些有正确大方向的问题,但是可能不够明确,不能令你着手去做。比如当你被要求建立一个模型时,你大概首先会想:(1)我们需要去解决的业务问题是什么?(2)建立的模型是否是解决这个问题的最佳方式?

令人伤心的是:不得不承认商业上的一些业务问题并不存在一套数据科学解决方案。因此,越早地发现是否值得去追求一套数据科学解决方案越好。
回答者#2 Yujun Deng
专注于机器学习、统计、最佳分析、NLP等方向


我从自己的失误中总结了一些个人经验。

1. 学会观察数据:

在把你的数据用于回归分析或机器学习的模型之前,先观察你的数据分布是很重要的。有些时候你也许会从一些完全不同的数据集中获得很相似的结果。就拿“安斯库姆四重奏”作为一个例子,下面的这四幅图中的数据有相同的均值、方差甚至连回归模型也一样。但是,很显然他们是互不相同的。
2. 得出推论才是你的终极目标:

我见过很多喜欢建模并且认为模型的选取是最重要的一个环节的人。但是,大多数人,尤其是那些非专业的人是不会关心你用什么样的模型的,他们想要知道的是经过你一番研究后得出的分析与结论。

3. 有良好表达能力

这与上面第二条的建议有关,而且不仅仅适用于数据学家。

如果你有良好的模型、精准的分析、合理的推断甚至一套完美的流程,但是你没有良好的表达能力,你仍不能将你的研究成果分享给你的上司或顾客。好的表达能力能给你带来更大的成就。
译者介绍




钟国敬

一个来自吉林大学的机器学习初学者


    关注 小象


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册