数据分析基础谈

 

数据误区:数据就是数字,就是表单,就是财务。数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用...





数据误区:数据就是数字,就是表单,就是财务。

数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的的原始素材。

数据是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。数据和信息是不可分离的,数据是信息的表达,信息是数据的内涵。数据本身没有意义,数据只有对实体行为产生影响时才成为信息。

数据可以是连续的值,比如声音、图像,称为模拟数据。也可以是离散的,如符号、文字,称为数字数据







数据

按性质分为

①定位的,如各种坐标数据;

②定性的,如表示事物属性的数据(居民地、河流、道路等);

③定量的,反映事物数量特征的数据,如长度、面积、体积等几何量或重量、速度等物理量;

④定时的,反映事物时间特性的数据,如年、月、日、时、分、秒等。

按表现形式分为

①数字数据,如各种统计或量测数据。数字数据在某个区间内是离散的值[1]  ;

②模拟数据,由连续函数组成,是指在某个区间连续变化的物理量,又可以分为图形数据(如点、线、面)、符号数据、文字数据和图像数据等,如声音的大小和温度的变化等。

按记录方式分为

地图、表格、影像、磁带、纸带。按数字化方式分为矢量数据、格网数据等。在地理信息系统中,数据的选择、类型、数量、采集方法、详细程度、可信度等,取决于系统应用目标、功能、结构和数据处理、管理与分析的要求。



先看看指标分解















闲说一句,昨天晚上和朋友在一起,他红着脸说

Data warehouse 就是数据库,而不是我说的数据仓库。我也没好反驳。刚刚找了下度娘,数据仓库显然有它特定的定义,与数据库是不同的。度娘说:

数据仓库(data warehouse)是一个面向主题的(subject oriented)、集成的(integrate)、相对稳定的(non-volatile)、反映历史变化(time variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。



还是举个例子吧



至于工具,昨天我已经说过,下图再发一遍



结语:因为本人水平关系,排版很烂,请谅解。另外这只是数据分析的常识介绍,实际操作要等以后慢慢讲解。文中图片本来都很清晰,只是我把它们都压缩了,可能影响观看,见谅吧。
-----老邪


    关注 老邪茶舍


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册