[数据趣展示] 揭秘!一幅可视化图表是如何构思出来的

 

本文又名“你发数据我来画”、“脑洞大开玩数据”。。。...

小编有话说

本文又名“你发数据我来画”、“脑洞大开玩数据”。。。

今天真爱粉一勇君发来一组数据,小编开动各种脑筋,构思出了多种图表,下面就和小编一起,还原一下图表的构思过程吧。

我们先来看看一勇君提供的原始数据:

地区

20**年

发明专利拥有量(件)

20**年

GDP(亿元)

A市

4223

3508.75

B市

6317

7315.19

C市

1089

1982.25

D市

943

1943.37

E市

972

2875.02

F市

571

1705.78

G市

159

494.41

H市

422

1333.64

I市

523

1884.48

J市

178

713.23

K市

399

1604.84

L市

525

2170.6

M市

204

992.85

N市

209

1260.55

O市

224

1803.93

P市

216

1807.09

Q市

213

2082.38

R市

184

1877.75

一勇君想要综合分析不同地区的发明专利拥有量和GDP情况。拿到这组数据之后,小编首先对表中的数据信息进行了拆解归类:

  • 信息数量看,需要通过可视化图表展现的信息有三个:地区、发明专利拥有量、GDP
  • 信息属性看,这三个信息可以归为两类:“地区”是类别数据,而“发明专利拥有量”、“GDP”则是对应各个类别下的两组数值数据
根据一勇君想要得到的分析结果和数据信息的属性,我们应当选用适于进行类别比较的图表类型,而两组数值数据一定程度上增加了分析难度,下面我们逐一来看看这些图表类型:
直角坐标系图表1:柱形图和条形图


为清晰起见,可以对其中一组数据如发明专利拥有量进行排序,从而排除干扰,专注观察另一组数据如GDP的走势。

在常见的直角坐标系中,说起类别比较的图表类型来,最容易浮现在脑海中的恐怕就是柱形图和条形图了。在这两种图表中:

  • 一个坐标轴用来安放数值数据,本实例中即为“发明专利拥有量和GDP”,而多组数值数据则对应了多组柱形或条形,柱形或条形的长度表示了数值的大小;
  • 另一个坐标轴用来安放类别数据,本实例中即为“地区”,柱形或条形之间的位置间隔将各个类别区分开来。如下表所示(以柱形图为例)。


表达信息

地区

发明专利拥有量

GDP

信息属性

类别信息

数值信息

数值信息

所处坐标轴

横轴

纵轴

纵轴

表达形式

柱形间隔

一组柱形长度

另一组柱形长度

直角坐标系图表2:散点图


如果将思维延展一下,“地区”作为类别数据不放在坐标轴上可不可以呢?我们可以将两组数值类信息,即本实例中的“发明专利拥有量”和“GDP”分别置于直角坐标系的X轴和Y轴,这样就形成了散点图,各个散点之间的位置间隔自然就将“地区”区分开来,如下表所示。

表达信息

地区

发明专利拥有量

GDP

信息属性

类别信息

数值信息

数值信息

所处坐标轴

横轴

纵轴

表达形式

散点间隔

沿横轴与原点距离

沿纵轴与原点距离
非典型直角坐标系图表3:树状图(Treemap)
如果脑洞再打开一些,能不能将直角坐标系也抛开呢?答案是当然可以啦。这个时候就要用到我们几次三番提到的树状图(Treemap)啦,其中面积大小和颜色深浅可以分别表示发明专利拥有量和GDP。



与其他类型图表相比,树状图有着独特的优势,紧凑的布局让读者能够一眼览尽全貌,方正的结构给人以稳定严谨的感觉。当然,这种图表类型的缺点是容易损失细节,读者对面积大小、颜色深浅的辨识度要远远小于对长度的辨识度。
地理坐标系图表4:地图
脑洞开到这里,你以为就这样结束了吗?不不不,我们再仔细观察一下数据,其中的第一列“地区”类数据不是现成的地图素材嘛。
所以,我们还可以画出上面这种三维地图,每个地区上面用两根柱形分别表示发明专利拥有量和GDP。这里小编用到了Excel2013以上版本中的Powermap功能,可以实时连接微软必应的地图数据生成图表。好啦,今天的图表可视化还原就到这里啦。

如果你对这些图表都不满意,欢迎文末吐槽或贡献新思路。

又或者你也有数据想变幻各种花样,快快发来一起互动吧。

来稿发送:3131602068@qq.com

版权声明:本文图文均为本公众号原创,水平所限,分析之处或有疏漏,欢迎各位看官拍砖,拍砖有礼相送,转载注明作者倩君和专利分析可视化即可 。
长按二维码关注专利分析可视化。


    关注 专利分析可视化


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册