科赛网专访牛娃风控总监路丹晖——从赛场到职场,迎面是朝阳也是波浪(二)

 

行业发展,形式万变,数据科学家进入职场,既要有思维和技能,更需耐得住等待。...



行业发展,形式万变。数据科学家想要获得更好的职业发展,既要做好自身知识储备,又要具有全栈思维,而更重要的是,耐得住人才需求的考验。



路丹晖

牛娃互联网金融风险数据管理中心 风险数据分析总监

2012 年 浙江大学信息与通信工程专业研究生毕业

2012-2016 先后就职于国内外知名金融、互联网公司,从事数据挖掘及统计建模相关工作。

Q1 目前企业在数据科学家的招聘和培养方面现状如何?

在国内,数据人才是比较依赖二线市场。即使像P&G这样的大公司,想要招一个对胃口的数据分析人才,也是存在困难的。从我能看到的角度说,非常多的优秀数据人才,都是一开始从一些外企,比如eBay、PayPal这类公司出来的。这些公司有非常健全的培训制度去教这些人才如何在工作中很好地应用他们所学到的知识。而国内在数据科学这个交叉学科,至少在我2012年毕业的时候,是没有相对应的课程的。当然我也看到了一些学习计算机、统计等专业的学生也在从事这个领域的工作。从培养的角度来说,高校确实是很重要的一方面;但另一方面,国内的企业也应该建立一套比较健全的培训体系,让大家在真实的case中获得成长,而国内绝大部分互联网公司基本上没有这种能力。

此外,从大环境上看,国内外所处的阶段有所不同。举个例子,我们在做市场营销时,仍然处于蛋糕没分完,大家在抢蛋糕的阶段。所以大部分公司都仍然在使用较野蛮的“一刀切”方式,不会太去追求精益化,而是去追求速度,这也导致很多优秀人才无法找准自己的位置。对比国外,已经进入了蛋糕分完转而争夺份额的阶段,这时候就需要比的是谁能用更好的方法做出更精细化的运营。现在我们并没有看到国内有非常多的缺口,主要是因为需求没有达到那么大。将来随着需求的增大,未来的五到十年,我认为这个需求和供给的缺口会越来越大。
Q2 对于想要转行大数据领域的其他行业工作者有何建议?

对于非常想转行大数据的工作者,我建议首先从各种比赛来入手。因为这些经历不但可以帮助积累知识,更重要的是这一经历可以帮助他们敲开行业的大门。入门之后再对所需要的知识和背景进行补充提升,这样的转型之路会相对平稳。过去想要转行,一般要么就找一份新的工作积累相关的实践经验,要么就通过重新读书提升理论知识基础。但现在可以通过参加比赛,同时积累实际经验和基础知识。

Q3 现如今相关学科的学生,如果想要从事大数据行业,有什么需要注意的地方?

大数据领域在这几年确实很热门,但这个趋势能维持多久尚不得知。所以对学校学生而言,最主要是考虑自己是否喜欢做这件事。这一行业其实远不如大家以为的有意思,需要做大量如数据清洗等枯燥的工作。所以个人的偏好是一个先决条件。

如果确定自己喜欢,那其次就是要注意储备相关的专业知识。实践的丰富不能完全代表理论的扎实。我建议大家不要过分关注建模,而应该把更多精力放在 “为什么”上面,比如统计学上如何选取样本,样本不平衡的时候应该怎么办等。因为当你有充分的理论指导,明白自己这样做的原因,效率会有很大的提高。我也知道有时候“暴力搜索”等方法可能会取得较好的结果,但这结果是无法被很好解释给别人听的,也会很难说服别人。

Q4 如果现在自己回到大学,会花更多的时间来做哪些事情?

我大学本科是通信工程,所以实际上和数据科学联系不多。主要是在工作中接触到了统计分析和建模的内容,慢慢建立了自己的知识结构。以此角度来回头看,最应该花费时间的地方是打好数学和统计的基础,因为自己在这方面可以说深受其害。

Q5 那具体在工作中,你是如何解决数学和统计基础不够扎实这一困难的?

我本科毕业于浙江大学,相对来说学校所拥有的资源算是比较丰富的。但即便如此,我也仍然能感觉到自己所学的知识很难直接应用于工作。这几年我一直学习国外的一些网络课程,发现他们在授课过程中会应用到很多真实的案例教学。这种教学方法的好处是能帮助学生在未来真实的工作环境下尽快辨别清楚问题类型,再选择合适的工具进行分析解决。所以从学校授课的角度来说,一方面应该注重知识本身,另一方面应该注重教会学生知识的应用。对应的,大家可以去多看一些国外的课程,来弥补国内教学上存在的不足。

Q6 你认为作为一个大数据行业的准从业人员,应具备哪些基本素质?

首先应该有较强的心理素质,不害怕犯错。从我自己和身边同行业人员的经验来看,做数据分析的没有不犯错的。举个例子,可能你分析上的一个错误,会导致公司策略失误,导致几千万的损失,这个时候就需要有坚强的心理来顶住压力。

其次就是要善于和人沟通交流。数据分析不仅是开发,闭门造车是行不通的。你所有的分析过程和结果都需要有人帮助实现应用,体现其价值。我见过很多技术过硬的人,因为沟通的问题,无法将做出来的东西上线,也就意味着价值没有获得体现。

Q7 确定转行大数据行业后,遇到过什么非常难解决的问题?是如何解决的?

我遇到的问题不是说在数据分析领域上的技术性问题,而是如何将分析的过程和结果以及对应的结论较好地展示给有决定权的人。扮演后台工作的角色时,想要去影响前台的决策,其实是非常难的。因为市场环境尚未做到精细化的程度,所以如果大家仍然在抢市场抢份额的阶段,数据分析的重要性并未被很好的认可。我们希望做到的是能够科学地影响决策,而非简单地输出报表,或者成为市场博弈的工具。

至于这个问题有没有被解决或者该如何被解决,还需要分行业和公司来说,无法一概而论。

Q8 在从事大数据行业后遇到的最大问题是什么?为什么觉得这是最大的门槛?是如何解决的?

主要是职业环境的问题,国内还没有特别适合数据科学家工作的岗位。举个例子,在百度,data scientist其实是非常偏engineer的。对应的,他们团队的组成架构和方式也会以engineer的套路来,但这并不是传统的data scientist团队的工作方式。百度尚且如此,其他公司的情况可想而知。一个data scientist的工作需要很多不同资源的配合,但这方面国内的公司里只有阿里做得很好。

当然这是一种较理想的职业环境。我有很多以前的同事去到了Facebook这样的公司,他们做的事确实和国内数据科学家们做的事区别很大。就像我之前说到的,一个真正的数据科学家的接触面会非常广,需要接触到业务、财务以及公司的很多方针,也需要通过数据的分析去主导一些事。另外从技能层面,他需要接触整套,包括从机器学习、数据清洗等多个层面的分析,所以全栈的思维要求是很高的。从国内情况来看,数据科学家可能更精通于某一块内容,比如建模的人主要就是建模,做策略就主要是做策略,做数据清洗就是做数据清洗,全栈思维仍然欠缺。

策划&采访   邓以勒 邓一乐

整理&编辑   苗怡佳 汪梦梦
下期预告
谈完行业,说完建议,我们更想知道行业前沿的人走过怎样的路。下期我们将进入路丹晖的数据科学研究,一一剖析前辈的技巧与心得。

推荐阅读

科赛网专访牛娃风控总监路丹晖——从赛场到职场,迎面是朝阳也是波浪(一)


信贷的本质:用理工思维理解金融系统风控中的大数据和机器学习


风控中的大数据和机器学习


Kesci数据实践

专业大数据竞赛平台




中国数据青年成长之家


    关注 Kesci数据实践


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册