【一】数据分析那些事

 

We are what we believe we are.x0a我就是我相信我会成为的那个人。...

1.1数据分析定义

1.1.1

【数据】又称观测值,是通过实验,测量,观察,调查,等方式获取的结果,以数量的形式表现。

【数据分析】用适当的统计分析方法对收集来的大量数据进行分析,将其进行汇总理解,以求最大化的开发数据的功能,发挥数据的作用,形成有效结论。

数据分析的类别:

  • 描述性数据
  1. 初级数据分析
  2. 方法:
  • 对比分析
对比分析法也称比较分析法,是把客观事物加以比较,以达到认识事物的本质和规律并做出正确的评价。

对比分析法通常是把两个相互联系的指标数据进行比较,从数量上展示和说明研究对象规模的大小,水平的高低,速度的快慢,以及各种关系是否协调。在对比分析中,选择合适的对比标准是十分关键的步骤,选择的合适,才能做出客观的评价,选择不合适,评价可能得出错误的结论。

  • 平均分析
  • 交叉分析
交叉分析法又称立体分析法,是在纵向分析法和横向分析法的基础上,从交叉、立体的角度出发,由浅入深、由低级到高级的一种分析方法。这种方法虽然复杂,但它弥补了“各自为政”分析方法所带来的偏差。

  • 分组分析
分组就是根据研究的目的和客观现象的内在特点,按某个标志或几个标志把被研究的总体划分为若干个不同性质的组,使组内的差异尽可能小,组间的差异尽可能大。分组分析法是在分组的基础上,对现象的内部结构或现象之问的依存关系从定性或定量的角度做进一一步分析研究,以便寻找事物发展的规律,正确的分析问题和解决问题。

  • 结构分析
结构分析法是在统计分组的基础上,计算各组成部分所占比重,进而分析某一总体现象的内部结构特征、总体的性质、总体内部结构依时间推移而表现出的变化规律性的统计方法。结构分析法的基本表现形式,就是计算结构指标

结构指标(%)=(总体中某一部分/总体总量)X100%

结构指标就是总体各个部分占总体的比重,因此总体中各个部分的结构相对数之和,即等于100%

  • 漏斗图分析
漏斗图适用于业务流程比较规范、周期长、环节多的流程分析,通过漏斗各环节业务数据的比较,能够直观地发现和说明问题所在。在网站分析中,通常用于转化率比较,它不仅能展示用户从进入网站到实现购买的最终转化率,还可以展示每个步骤的转化率

  • 综合评价分析
主要有打分综合法、打分排队法、综合指数法、功效系数法等。

  • 因素分析
因素分析法是利用统计指数体系分析现象总变动中各个因素影响程度的一种统计分析方法,包括连环替代法、差额分析法、指标分解法等。 因素分析法是现代统计学中一种重要而实用的方法,它是多元统计分析的一个分支。使用这种方法能够使研究者把一组反映事物性质、状态、特点等的变量简化为少数几个能够反映出事物内在联系的、固有的、决定事物本质特征的因素。

  • 矩阵关联分析
关联矩阵法是常用的系统综合评价法,它主要是用矩阵形式来表示每个替代方案有关评价指标及其重要度和方案关于具体指标的价值评定量之间的关系。

  • 探索性数据
  • 验证性数据
  1. 高级数据分析
  2. 方法:
  • 相关分析,
  • 因子分析,
  • 回归分析
  • 聚类分析
  • 判别分析
  • 主成分分析
  • 对应分析
  • 时间序列
数据分析的作用:

  • 现状分析
  1. 现阶段整体运营情况:通过指标分析经营的好坏程度
  2. 输出形式:日报,周报,月报等日常通报
  • 原因分析
  1. 分析原因,调整策略
  2. 输出形式:专题分析
  • 预测分析
  1. 预测发展趋势
  2. 输出形式:季度,年度计划的专题分析
1.2数据分析六部曲:

1.2.1明确分析目的和思路

  • 一切以解决实际问题为目的
  • 思路:构建体系化的分析框架-以营销,管理理论为指导,结合实际业务情况搭建
  1. 营销理论模型:
  • 4P
4p理论以一种营销理论即;Product,Price,Place,Promotion取其开头字母。中文意思为,产品,价格,渠道,促销。

Product:从市场营销的角度来看,产品是指能够提供给市场被人们使用和消费并满足人们某种需要的任何东西,包括有形产品、服务、人员、组织、观念或它们的组合。

Price:是指顾客购买产品时的价格,包括折扣、支付期限等。价格或价格决策,关系到企业的利润、成本补偿、以及是否有利于产品销售、促销等问题。

影响定价的主要因素有三个:需求、成本、竞争。

最高价格取决于市场需求,最低价格取决于该产品的成本费用,在最高价格和最低价格的幅度内,企业能把这种产品价格定多高则取决于竞争者同种产品的价格。

Place:所谓销售渠道是指在商品从生产企业流转到消费者手上的全过程中所经历的各个环节和推动力量之和。

Promotion:促销是公司或机构用以向目标市场通报自己的产品、服务、形象和理念,说服和提醒他们对公司产品和机构本身信任、支持和注意的任何沟通形式。广告、销售促进、人员推销、公共关系是一个机构促销组合的四大要素。

  • 用户使用行为
  • STP理论
市场细分(Segmentation)、目标市场选择(Targeting)和定位(Positioning)。它是战略营销的核心内容。

市场细分是指根据顾客需求上的差异把某个产品或服务的市场划分为一系列细分市场的过程。

目标市场是指企业从细分后的市场中选择出来的决定进入的细分市场,也是对企业最有利的市场组成部分。

而市场定位就是在营销过程中把其产品或服务确定在目标市场中的一定位置上,即确定自己产品或服务在目标市场上的竞争地位,也叫“竞争性定位”。

  • SWOT
SWOT分析法是用来确定企业自身的竞争优势、竞争劣势、机会和威胁,从而将公司的战略与公司内部资源、外部环境有机地结合起来的一种科学的分析方法。

2.管理理论模型:

  • PEST


  • 5W2H
  • 时间管理
  • 生命周期
  • 逻辑树
逻辑树又称问题树、演绎树或分解树等。麦肯锡分析问题最常使用的工具就是“逻辑树”。逻辑树是将问题的所有子问题分层罗列,从最高层开始,并逐步向下扩展。

  • 金字塔
  • SMART原则
  1. 目标必须是具体的(Specific)
  2. 目标必须是可以衡量的(Measurable)

3. 目标必须是可以达到的(Attainable)

4. 目标必须和其他目标具有相关性(Relevant)

5. 目标必须具有明确的截止期限(Time-based)

无论是制定团队的工作目标还是员工的绩效目标都必须符合上述原则,五个原则缺一不可。

1.2.2数据收集

  • 数据库:公司内部
  • 公开出版物:统计年鉴或报告
  • 互联网
  • 市场调查
1.2.3数据处理

【数据处理】对收集的数据加工整理,形成适合分析的样式。

  • 数据清洗
  • 数据转化
  • 数据提取
  • 数据计算
1.2.4数据分析

  • Excel
  • SPSS Statistics
1.2.5数据展现

  • 图表+图形
  • 图表:饼图,柱状图,条形图,折线图,散点图,雷达图
  • 图形:金字塔图,矩阵图,漏斗图,帕累托图
帕累托图是一种按发生频率排序的特殊直方图。在质量管理中,可以通过帕累托图显示每种已识别的原因分别导致了多少缺陷。排序的目的是为了有重点地采取纠正措施。项目团队首先要处理那些导致最多缺陷的原因。

1.2.6报告撰写

目录包括:

  • 分析背景和目的
  • 分析思路
  • 分析正文
  1. XX分析
  2. XX分析
  3. XX分析
  4. XX分析
  • 总结和建议
1.3分析的三大误区

  • 目的不明确,为了分析去分析
  • 缺乏业务知识,分析结果偏离现实
  • 一味追求高级分析方法,热衷研究模型
1.4数据分析师的职业发展

1.4.1前景

将数据转化为知识,结论和规律,是数据分析的作用和价值,产品经理需要具备数据分析的能力!

1.4.2职业要求

  • 懂业务
熟悉行业知识,公司业务流程,比如运营收入的业务收入构成,主要业务,最小收入业务,最高收入地区

  • 懂管理
  1. 搭建分析框架
  2. 提建议
  • 懂分析
  • 懂工具
  • Excel(掌握此技能符合2/8原理)
  • SPSS Statistics
Statistical Product and Service Solutions,“统计产品与服务解决方案”软件SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。

  • SAS
SAS系统主要完成以数据为中心的四大任务:数据访问;数据管理(sas 的数据管理功能并不很出色,而是数据分析能力强大所以常常用微软的产品管理数据,再导成sas数据格式.要注意与其他软件的配套使用);数据呈现;数据分析

  • Access
access有强大的数据处理、统计分析能力,利用access的查询功能,可以方便地进行各类汇总、平均等统计。并可灵活设置统计的条件。比如在统计分析上万条记录、十几万条记录及以上的数据时速度快且操作方便,这一点是Excel无法与之相比的。

  • 懂设计
  1. 版式
  2. 图形
  3. 颜色
1.4.3基本素质

  • 态度严谨
  • 好奇心
  • 逻辑清晰
  • 模仿学习
  • 勇于创新
1.5常用指标术语

【平均数】算数平均数,所有数据综合/数据个数

【几何平均数】几何平均数是n个变量值连乘积的n次方根。

几何平均数多用于计算平均比率和平均速度。如:平均利率、平均发展速度、平均合格率等。

【调和平均数】又称倒数平均数,是总体各统计变量倒数的算术平均数的倒数。

简单调和平均数

加权调和平均数

调和平均数:Hn=n/(1/a1+1/a2+...+1/an)

几何平均数:Gn=(a1a2...an)^(1/n)

算术平均数:An=(a1+a2+...+an)/n

平方平均数:Qn=√ [(a1^2+a2^2+...+an^2)/n]

这四种平均数满足 Hn ≤ Gn ≤ An ≤ Qn

【绝对数】

总人口,GDP,数量增减变化的绝对数

如:5000万人,1000万元,300米,500家,多了500个……

【相对数】

相对数=比较数值(比数)/基础数值(基数)

倍数,成数,百分数

如:20%,6倍,1:5,8成,120元/人

QQ模型:

绝对数是数量,相对数是质量

第一个Q,就是数量(Quantity),也是我们常说的绝对数指标,例如收入、用户数、渠道数、GDP、人口数等绝对数指标,主要用来衡量事物发展的规模大小情况;

第二个Q,就是质量(Quality),也是我们常说的相对数指标,例如利润率、留存率、覆盖率、人均GDP、人均消费等相对数指标,主要用来衡量事物发展的质量高低情况;

【百分比】百分率或百分数

【百分点】相对指标的变动幅度,1个百分点=1%

【频数】一组数据中个别数据重复出现的次数

【频率】每组类别次数与总次数的比值

  1. 百分数表示
  2. 所有组的频率加一起=100%
【比例】各部分数值占全部数值的比重,反映总体的构成和结构

【比率】不同类别数值的对比

【倍数】一个数除以另一个数得的商

A/B=C,同理,A=B·C,所以,A是B的C倍

  • 只表示增长幅度
  • 不适合数量减少
【番数】原来数量的2的N次方倍

如:

  • 翻一番 6.4=3.2×2¹
  • 翻两番 12.8=3.2×2²
【同比】与同历史时期进行比较得到的数值

  • 反映事物发展的相对情况
【环比】与前一个统计时期进行比较得到的数值

  • 反映事物逐期发展的情况


    关注 C12heart


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册