广东审协中心第四次微群培训

 

如何应用快速浏览全文功能,发现对比文件;如果发现了一篇对比文件,如何扩大结果,发现更多的对比文件?...



如果已经找到一个对比文件,是不是很快还可以找到与此相关的其它对比文件?

信息处理中有个叫“cluster theory”(聚类理论),大概意思是,如果找到一个相关的文献,往往会是一个cluster(类)的相关文献在它的附近。

如何在已经找出对比文件X的情况下,充分利用cluster theory,找出其它相关的X、Y文件?

在patentics的语义检索里,这是非常容易的一件事。

比如说,我们用表达式 r/A and di/A and... 找到了A申请的对比文件X

我们只有用 r/X and di/A 后面加或不加限定部分,就可以找到与X相关,公开日是在A的申请日之前的其它文献。

@Happy提了一个很好的问题,就是说有一篇很好的对比文献 X',很相关,但是时间不可用,我们可以用X'为排序参考,r/X' and di/A进行排序检索。

r/X'与r/A可能是相似的发明,不同的表示。也有可能本申请的攥写质量欠缺,而X’的攥写刚好弥补了这方面的缺陷。

我们下面介绍全文浏览界面时,我们把应用这个方法也加进去。
我们机器翻译功能有很大的提升。因为我们有美国1000万全文,标准英文模型,通过深度学习获得的,我们还有1200万中国全文的标准中文模型,而且这2个复杂的数学模型,我们通过语义关系,建立关联关系。这个关联关系是巨量的。所以,我们叫语义翻译。
大家一定要看看这些,其实对大家的工作会有非常大的帮助。这些是技术特征的自动理解出来的4个主题。

4个主题,分的很清楚。现在是只支持中文库,下一步我们马上要支持英文库。

这个意义很大,就是说30年的中国发明,我们可以通过计算,理解、获取发明的内容。

我们知道美国专利系统是全球技术水平最高。怎么个高?我们通过计算自动理解了美国1000万专利、申请和中国1000多万的专利、申请。做了比较,发明内容的量级,大概是5倍左右。
这个是全文机器自动标引结果,前面介绍的是主权项的机器自动标引结果。

现在我们去看看机器翻译后的中国申请的英文机器标引如何?

快速获取该中国申请的英文信息,如下


下面我们介绍正题,

1. 如何应用快速浏览全文功能,发现对比文件;

2. 如果发现了一篇对比文件,如何扩大结果,发现更多的对比文件?

我们用实例来说明。







Patentics检索入口,www.patentics.com/scn.htm 我们从输入该申请号入手,
画圈的都是点击的地方。我们马上可以分析本申请的主要技术要素及它们的分布
我们知道,这个申请的主要发明点是镜射、镜射区、镜射数据。所以我们勾选这些词,并点击小工具条上的‘或’按钮













看到第3篇时,我们发现这些文献都是讲‘镜射’在磁盘阵列上的应用。

如何去掉这些磁盘阵列的文献,有2个方法可行,

1. 回到原来的检索界面,添加 b/(a and b and c andnot 阵列)

2. 是在全文浏览里添加“阵列”,进行关注,如果浏览文献中有“阵列”,且该数值不是0,可以考虑快速“下一篇”。

我们用方法1,回到检索界面。检索界面就在该tab的左边。







这样看下去,我们马上发现,里面少一个“读取”的技术要素,所以我们就在特征词里加上“读取”,“读”

必须指出,加这些词不会影响我们的结果,(不会漏),只是提醒,帮助大家快速判断。





我们马上发现,本申请里有个“读取出错”的限制。因为像这样的检索结果,已经很靠近你的目标,你就不需要回检索式修改,而是通过添加高亮词,通过快速浏览来提醒那些是你最终想要的对比文件。

注意,这里是1100篇开始浏览的,现有系统是不可能的,因此大家还要化精力去用检索策略限定,导致漏检。
我又加了个‘错’,同时我把'忽略'去掉了,因为我刚才看了一些文献。不然,系统对于那些浏览过的文献,又选中‘忽略’的,就不显示了!
我们发现,cn201285544,是个X文献。大家可以与分析中给出的X比比看。
还有,这篇对比文献通篇没有用“闪存”,而是用来“固态硬盘”,和ssd。而大家都知道,固态硬盘和ssd就是用闪存做的。

我们已经找到了一篇X对比文件,下面我们进行一个快速测试,是否还有与该对比文件相关的其它文件,也可以用作对比文件?













这篇可能是个Y文献
可以,我们等会介绍。

接下去,我们继续浏览下去。注意,被匹配的高亮关键词,都可以点击,快速定位该关键词。











如果回到searchcn.htm的界面,我们可以马上发现我们的对比文件的扩充集,有个相关度的不连续点。在通过检索策略定义的1100篇文献中,只有排在前面的几篇有用。其中,一篇是本申请,另一篇就是发现的Y文献。

我们现在介绍一下如何导入一批公开号,根据你的需要,快速进行语义排序。

准备导入文件,一行一个,

《无效检索也可以这样!》

《广东审协中心首次次微群培训》

《广东审协中心第二次微群培训》

《广东审协中心第三次微群培训》
 
有意入patentics微信检索、分析技术讨论群者,请加管理员微信,有管理员拉您进群。

微信公众号:patentics_public (←长按复制)

www.patentics.com  sales@patentics.com


    关注 Patentics智能语义


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册