[数据处理]用excel进行地域分布分析

 

如何利用excel获取地域分布分析所需数据。...





大家好,又到了[数据处理]时间,今天,我们继续介绍用excel进行地域分布分析

地域分布分析可以反映一个国家或者地区的技术研发实力、技术发展趋势、重点发展技术领域、主要市场主体等,也可以反映国际上对该区域的关注程度等。

就中国专利而言,地域信息包括国内申请人所在的省市信息、国外来华申请人的国籍信息及国内、国外申请人类别信息。

以下是源xls数据



观察上述源数据可知,国内申请人所在的省市信息中,同时出现了类似“江苏”、“南京”的信息。因此,当我们进行中国34个省级行政区域的专利申请的地域分布分析时,需要对上述类似“江苏”、“南京”的地域信息进行规范

综上,地域分布分析的数据处理流程为

  1. 删除地域信息中的数字、字母代码,仅保留文字(可选步骤)
  2. 规范国内申请人所在的省市信息
  3. 标引“国内申请人”、“国外申请人”信息
Step1 删除地域信息中的数字、字母代码,仅保留文字(可选步骤)

方法1:利用“(”分列

在“国家/省市”列右侧插入1个空白列,选中“国家/省市”列数据,点击“数据”选项卡里的“分列”,在弹出的对话框中,选择“分隔符号”,点击“下一步”,勾选“其他”,并输入“(”,点击“完成”。



方法2:利用mid、find函数

插入空白列,命名为“国家/省市-辅助”,输入公式:=MID(H2,1,FIND("(",H2)-1)

公式解释:从H2单元格字符串的第1位开始提取,提取的长度为“(”所在位置-1



Step2 规范国内申请人所在的省市信息

插入空白列,命名为“国家/省市-清理”,自定义筛选“国家/省市-辅助”列内数据,依次将类似“南京”、“成都”等信息规范为对应的34个省级行政区域。



自定义筛选或借助定位条件(快捷键F5)选中“国家/省市-清理”列中的“空白”单元格,输入公式:=I2(引用I列单元格信息),并按ctrl+enter完成填充。



Step3 标引“国内申请人”、“国外申请人”信息

插入空白列,命名为“申请人国别”,自定义筛选“国家/省市-清理”列数据,勾选国外国家或地区信息后,选中“申请人国别”列,输入“国外申请人”,并按ctrl+enter完成填充。



自定义筛选或借助定位条件(快捷键F5)选中“申请人国别”列中的“空白”单元格,输入“国内申请人”,并按ctrl+enter完成填充。



实际操作中,可根据具体情况决定“国内申请人”、“国外申请人”的标引顺序。

好了,今天就到这里,上述方法并不一定是最佳或唯一方法,欢迎各位拍砖并来稿。

猜你喜欢:

  • [数据处理] 有了这篇教程,SIPO小伙伴再也不怕倒腾数据啦
  • [数据处理] 用excel进行申请趋势分析
  • [数据处理]用excel进行申请类型分析
  • [数据处理]用excel进行申请人排名分析
  • [数据处理]用excel进行申请人类型分析
来稿发送:3131602068@qq.com

欢迎各位看官转载:注明作者赖俊科及专利分析可视化即可
长按二维码关注专利分析可视化


    关注 专利分析可视化


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册