[数据处理]用excel进行申请人排名分析
如何利用excel获取申请人排名分析所需数据。...
大家好,之前的[数据处理]教程介绍了:
- 利用if、mid、find函数从“申请日”和“优先权信息”中获取申请年份信息,以及利用数据透视表快速统计各申请年份申请量数据(相关阅读☞[数据处理] 用excel进行申请趋势分析);
- 利用if、len、mid函数从“申请号”、“公开号/公告号”中获取申请类型信息,以及利用数据透视表快速统计不同申请类型各申请年份的申请量数据(相关阅读☞[数据处理]用excel进行申请类型分析)。
以下是源xls数据对申请人的申请量/授权量/有效量等进行排名,能够从众多市场主体中遴选出值得分析的重要市场主体,从而进一步挖掘出这些重要市场主体的研发重点、研发方向、主要市场和发展规划等信息,提供更具体、更有针对性的专利情报。
由于同一申请人在数据库中的名称可能不统一,因此,在进行申请人分析之前,需对申请人名称进行规范、合并。常见的需要规范、合并的情况涉及:
- 申请人名称的表述差异
- 总公司与子公司
- 合资公司
- 兼并重组
- 公司更名
此外,由于一件专利申请可能存在多位申请人,因此,在进行申请人排名分析之前,需将该存在多位申请人的一件专利申请拆分为多件,如,一件专利申请包括A、B、C三位申请人,在进行申请人排名分析时,需将该专利申请针对A、B、C每位申请人分别计数,即重复计数三次。
综上所述,对于申请人排名分析,数据处理的思路是
- 将存在多位申请人的专利申请拆分为多件
- 对申请人名称进行规范、合并
- 统计各申请人的申请量数据
然而,对所有申请人的名称进行规范、合并是相当繁杂的一项工作,在实际操作过程中,可根据分析需要对所关心的申请人的名称进行规范、合并。如仅关心排名前十的申请人的情况,可仅对排名靠前的申请人名称进行规范、合并,本期就针对这一常见的需求(分析排名靠前的申请人)来介绍。
因此,数据处理的思路进一步细化为
- 将存在多位申请人的专利申请拆分为多件
- 统计各申请人的申请量数据
- 对申请量排名靠前的申请人的名称进行规范、合并
观察源数据可知,多位申请人之间采用“、”间隔
拆分方法:选中“申请人”数据,点击“数据”选项卡中的“分列”,在弹出对话框中选择“分隔符号”,点击“下一步”,勾选“其他”,并输入“、”,点击“下一步”或直接点击“完成”,实现多位申请人的拆分。
录屏操作如下
Step2 统计各申请人的申请量数据
将多列申请人数据合并至一列,如将下图中B列的申请人数据拷贝至A列末端
这还不简单?复制B列,滚动至A列末端,粘贴,搞定!
问:为什么不行?另外,怎么瞬间定位到A列最后一个单元格的?
答:为什么不行,截图里有答案;对于怎么瞬间定位到A列最后一个单元格,点击A列任一有内容单元格,ctrl+下箭头,瞬间定位到该列最后一个有内容的单元格,其他箭头同理。
问:上面的方法不行,那怎么合并至A列?
答:方法很多,这里介绍两个
方法1 选中B列,排序,以当前选定区域排序,复制B列数据至A列末端,对其他列重复上述操作
方法2 选中B列,快捷键F5或ctrl+g调出“定位条件”,选择“常量”,自动选择该列非空内容,复制,定位至A列末端,粘贴,对其他列重复上述操作。
利用数据透视表统计各申请人的申请量数据
Step3 对申请量排名靠前的申请人的名称进行规范、合并
对数据透视表中的“计数项”进行降序排序,复制整个数据透视表内容至新的工作表
利用自定义筛选,对申请量排名靠前的申请人的名称进行规范、合并
假设通过前期调查,确定将申请人名称中含“丰田”的申请人名称统一规范为“丰田”。
对其他申请人重复上述操作。
最终完成申请人排名分析。
注意:强烈建议大家在实际操作过程中保存好源数据、中间数据,方便回看、修改。
好了,今天就到这里,上述方法并不一定是最佳或唯一方法,各位可根据自己的分析需求,灵活运用上述技巧,欢迎各位拍砖并来稿。
此外,在常规申请人排名分析的基础上增加时间的维度往往能发现预想不到的信息,请大家思考如何快速实现申请年份与申请人之间申请量的交叉统计。
猜你喜欢:
- [数据处理] 有了这篇教程,SIPO小伙伴再也不怕倒腾数据啦
- [数据处理] 用excel进行申请趋势分析
- [数据处理]用excel进行申请类型分析
欢迎各位看官转载:注明作者赖俊科及专利分析可视化即可
长按二维码关注专利分析可视化
关注 专利分析可视化
微信扫一扫关注公众号