上一篇专利数据统计中需要搞清楚的首要问题(1)介绍了通过合并申请号避免重复统计,理清了专利篇数和专利件数的问题,那么还有一类统计就是对发明项数的统计,这里就涉及到对同一项发明的重复统计问题。上一篇介绍的相同申请号但不同公开号的专利是“同一项发明”,而同一项发明在不同国家申请,也会产生不同的版本,例如阿里巴巴在中国申请某项专利后,为了在欧洲获得保护,又在欧洲申请了相同的专利,由于发明内容相同,也属于同一项发明创造,但公开号和申请号都不相同,这就是我们常说的专利族(同族),在统计阿里巴巴有多少项专利技术时, 就需要去除这些在不通专利局的重复公开版本(也就是同族合并处理),将在不同专利局申请的同一项发明创造合并为一条记录,这样也可以避免重复浏览。

我们再回顾一下专利族的定义,专利族常用的有简单同族和扩展同族。简单同族信息根据DocDB给出的简单同族ID加工,根据定义,简单专利族成员优先权完全一致,等同于“also published as”,是定义较为严格范围较窄的专利家族。扩展同族信息根据优先权信息加工,根据定义,扩展专利族的文献之间至少能通过一个优先权发生关联,是范围更广的专利家族。

WIPO对简单专利族和扩展专利族的定义如图所示。

例如统计阿里巴巴在全球有多少项发明创造,使用(阿里巴巴 OR ALIBABA)/pa选择全球数据库进行检索。什么?你怎么知道阿里巴巴的英文是ALIBABA?如果想知道某家企业常使用的英文名,只需要使用中文名进行检索,然后统计申请人名称选择DOCDB统计项就可以了,DOCDB是欧专局的数据库,会将全球申请人的名称统一翻译为英文。

HimmPat的检索结果显示的XXXX个公开号码,点击下拉框可以对检索结果进行合并处理,包括简单专利族合并和扩展专利族合并,并且提供两层保留条件,例如想要优先看中文的,则首要保留条件选择受理局,优先保留CN文献,其次中国专利中仍然可能有多篇专利属于同一个专利族,例如公开版本和公告版本,可以通过同族代表文献、申请日和公开日设定想要保留的文献。这样针对技术项数的统计结果就会更准确了。

除此之外,HimmPat还对常用的统计参数加工了以申请号和专利族为统计单位的字段。例如:同族数量是非常重要的参数,但以公开号为单位统计同族数量则会有重复统计,因此,分别加工了简单同族公开号个数和简单同族申请号个数,扩展同族公开号个数和扩展同族申请号个数检索字段,甚至同族国家数检索字段,让统计更加准确。

针对引用信息分别加工了引文公开号数量和引文申请号数量检索字段,同时将同一申请号专利的引文算作其共同的引用,例如申请公开版本引用了专利A,授权公告版本引用了专利B,则专利A和专利B都将视作该申请号下所有专利的引文,真正做到以专利为单位的统计。

针对被引用信息,同样将同一申请号专利的施引算作其共同的施引,例如申请公开版本被专利A引用,授权公告版本被专利B引用,则专利A和专利B都将视作该申请号下所有专利的施引专利。

施引专利信息不仅分别加工了施引专利公开号数量和施引专利申请号数量,还分别将同一简单家族和扩展家族的施引算作其共同的施引进行了施引专利数量的统计,分别加工了简单家族施引专利公开号数量、简单家族施引专利申请号数量、扩展家族施引专利公开号数量、扩展家族施引专利申请号数量,甚至相应的施引专利国别数量检索字段。

更进一步,还将施引专利以简单家族和扩展家族为单位进行了施引专利数量的统计,分别加工了施引专利简单家族数量和施引专利扩展家族数量。

没想到因为重复公开的问题,对专利数据的统计有这么大的影响,希望以上字段加工能让你的检索和统计更加准确。


相关阅读:

  • 全球专利高精度智能语义检索上线:25局专利全语种智能语义检索,强劲加持专利人疫情期间高效办公

  • HimmPat检索功能快速上手指南

  • 用“S系统”,做检索超人

  • 2019年局专利检索大赛机械领域真题能教会你什么

  • 2019年局专利检索大赛电学领域真题能教会你什么

  • 这些隐藏功能你会用吗?

  • 2020“检索之美”专利检索技能与经验有奖征文

  • 107组273项简单统计功能上线

  • 浏览更高效:申请号合并/同族合并功能上线

  • 智能语义更可控:语义检索支持忽略背景技术

  • 智能岂止语义,图像检索上线

  • 沉浸式检索体验之检索历史触手可及

  • 沉浸式检索体验之分类信息如影随形

  • 【检索智能引导功能上线】引导常规步骤,激发检索灵感

  • 【权利要求对比功能】——寻找“安全”实施范围和技术研发空间

  • 同族扩展等12类批量扩展检索上线

  • 这些检索细节90%的检索员不知道

  • 智能附图标记,轻松阅读附图

  • 多项检索功能优化,持续提高检索效率

  • 一键统计三率,270+统计维度绘制统计图表【征集常用统计项】

  • 177可下载字段,自定义导出模板

  • 新增各大专利局相似专利检索智能引导

  • 批量检索方式,你知道几种?

  • 专利数据统计中需要搞清楚的首要问题(1)

delhpi7 tcombobox清楚重复项_专利数据统计中需要搞清楚的首要问题(2)相关推荐

  1. delhpi7 tcombobox清楚重复项_数据分析必须想清楚的两个概念:指标和维度

    指标与维度是数据分析中最常用到的术语,它们是非常基础的,但是又很重要,经常有朋友没有搞清楚它们之间的关系,只有掌握理解了,我们的数据分析工作开展就就容易多了.现在就来说说指标与维度的那些事. 1.指标 ...

  2. python去掉字典重复项_从字典列表中删除重复项python

    我正在尝试从下面的列表中删除重复项distinct_cur = [{'rtc': 0, 'vf': 0, 'mtc': 0, 'doc': 'good job', 'foc': 195, 'st': ...

  3. python从后面删除重复项_如何从Python列表中删除重复项

    如何从Python列表中删除重复项 了解如何从Python中的List中删除重复项技巧. 实例 从列表中删除任何重复项: mylist = ["a", "b", ...

  4. CNZZ 移动统计_移动数据统计_移动应用分析_ APP统计

    CNZZ 移动统计_移动数据统计_移动应用分析_ APP统计 http://mobile.cnzz.com/help.php?h=Android_SDK_Download_and_Usage_Manu ...

  5. 【数模】数据统计中的峰度与偏度

    数据统计中的峰度与偏度 峰度: 峰度(peakedness:kurtosis)又称峰态系数.表征概率密度分布曲线在平均值处峰值高低的特征数. 峰度包括正态分布(峰度值=3),厚尾(峰度值>3), ...

  6. 数据透视表里填充重复项_数据透视表填充颜色消失

    数据透视表里填充重复项 Microsoft just announced the winner of their Excel World Champ data visualization contes ...

  7. excel查找一列重复项_列中最后一项的Excel查找公式

    excel查找一列重复项 How can you get the last number in an Excel column? I needed to do that in one of my sa ...

  8. python列表删除重复项_五分钟学会三种Excel重复项删除方法,工作效率大杀器!...

    点击蓝字 关注我们 在统计数据过程中, 同一份数据可能由于渠道的不同而进行了多次统计, 在输入数据时, 可能因为操作失误重复输入数据.种种原因造成数据表中的数据存在重复现象, 删除重复数据是数据清洗的 ...

  9. WPS高亮显示重复项并删除重复项有效防止数据重复录入

    在录入众多数据之后,难免会有一些重复,对于这些重复的数据可以高亮显示,如此一来就会提高工作效率,那么如何高亮重复项和删除重复项呢?下面有个不错的教程,全程为大家详细讲解一下.有不会的朋友可不要错过喽, ...

最新文章

  1. ssh服务器拒绝证书,使用SSH.NET以密钥文件连接到SFTP(权限被拒绝(publickey))...
  2. 一文读懂卷积神经网络
  3. 再来一次的C语言贪吃蛇小游戏(三)
  4. Jupyter notebook 使用过程中的一些小技巧总结
  5. php ci 框架 扩展缓存类,CodeIgniter扩展核心类实例详解
  6. linux的驱动开发——字符设备驱动
  7. (90)FPGA比较器设计
  8. css链接,列表,表格
  9. 【Flink】 Flink 源码之 Buffer Timeout优化
  10. linux时间界面返回,Android开发教程:游戏过程中按Home键后返回游戏界面
  11. vivado根据语言模板定义一般IO的管脚约束文件xdc
  12. 家庭上网用路由器和ADSL的连接
  13. linux车机carplay模块,卸甲科技UI2.0版本Linux车机发布
  14. Photoshop教程:10秒闪电搞定照片构图
  15. 惠普服务器关机自动重启,惠普电脑关机后自动重启怎么解决
  16. html中颜色打字机效果,基于Css3和JQuery实现打字机效果
  17. 460.LFU 缓存
  18. 企业信用代码等常用的正则验证
  19. TF卡里删掉文件后内存没变大_双11,TF卡,SD卡,读卡器如何选,看这篇就够了...
  20. 从新手到专家:如何设计一套亿级消息量的分布式IM系统

热门文章

  1. 【渝粤题库】广东开放大学 系统工程 形成性考核
  2. 【渝粤题库】陕西师范大学201491 法学导论作业
  3. 【渝粤题库】广东开放大学 外贸会计1 形成性考核
  4. php 字符串索引值,PHP:字符串索引不一致?
  5. 404 单页应用 报错 路由_通过 Laravel 创建一个 Vue 单页面应用(五)
  6. fanuc机器人与视觉通信_要说工厂干起活来:工业机器人和数控机床才是真正的一对!...
  7. java mousepress_Java线程原语弃用
  8. java计算整数出现的次数_[剑指offer题解][Java]1到n整数中1出现的次数
  9. 全国计算机三级数据库技术选择题,全国计算机三级《数据库技术》选择题训练2016...
  10. 【强化学习】Policy Gradient原理