[数据处理] 用excel进行申请趋势分析
如何利用excel获取申请趋势分析所需数据。...
编者按
上周我们发布了如何将txt的专利数据导到excel中,以便进一步的数据分析。那篇文章收获了小伙伴们不少的赞,我们也发现,小伙伴对于可视化之前如何获取数据的需求也是很多的,因此,我们打算把[数据处理]这个栏目继续做下去,给大家分享如何利用excel进行数据处理。
我们会按照专利分析的维度来为大家介绍数据处理的方式,比如专利申请趋势分析、区域分布、五局流向、申请人合作网络、技术功效分析等等。
今天,我们首先为大家带来专利申请趋势分析的数据处理。
下图就是一个以txt数据导成excel的数据样式。不同源xls数据的字段、内容存在差异,但数据处理的流程、方法可相互借鉴。
数据处理思路
申请趋势分析的步骤可以分为以下两个步骤:
- 获取申请年份信息,其中,有优先权的从优先权日提取,否则从申请日提取
- 统计各年份申请量数据
Step1 获取申请年份信息
插入空白列,空白列命名为“申请年份”。
申请年份的提取:有优先权的从优先权日提取,否则从申请日提取。
在“申请年份”的空白表格中输入公式,公式及相关解释如下:
Step2 统计各申请年份申请量数据
统计各申请年份的申请量数据可以采用数据透视表来统计。
数据透视表是一种对大量数据快速汇总和建立交叉列表的交互式动态表格,能帮助专利分析人员分析和组织专利申请数据。
今天我们要介绍的是如何利用数据透视表的多条件统计功能快速统计各申请年份申请量数据。
1. 插入数据透视表
*excel2007以上版本的数据透视表在插入选项卡内,excel2003版的数据透视表在数据选项卡内。
2. 快速统计
将申请年份字段拖至行标签,并将申请年份字段再次拖至值标签,快速完成各申请年份数据统计!
补充步骤:规范数据格式发现问题:在上图中可以发现,数据透视表统计结果中包括2件#VALUE!。
查找问题:返回源xls数据中查找发现,优先权单元格中存在不能打印的字符(此处为回车),使得单元格不为空,导致mid函数报错。
解决问题:
删除单元格中不能打印的字符
修改申请年份提取函数
刷新数据透视表(快捷键Alt+F5)
#VALUE!消失
Done!
好了,今天就到这里,上述方法并不一定是最佳或唯一方法,欢迎各位拍砖并来稿。
来稿发送:3131602068@qq.com
欢迎各位看官转载:注明作者赖俊科及专利分析可视化即可
长按二维码关注专利分析可视化
关注 专利分析可视化
微信扫一扫关注公众号