(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210105810.8
(22)申请日 2022.01.28
(71)申请人 安徽大学
地址 230039 安徽省合肥市蜀山区肥西路3
号
(72)发明人 赵姝 鲁凡 陈嘉琳 陈洁 段震
钱付兰 张宇航
(74)专利代理 机构 合肥市浩智运专利代理事务
所(普通合伙) 34124
专利代理师 朱文振
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06Q 50/18(2012.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于网络表示学习和层次标签嵌入的专利
分类方法及系统
(57)摘要
本发明提供一种基于网络表示学习和层次
标签嵌入的专利分类方法及系统, 方法包括: 获
取包含类别标签等数据的专利信息; 利用专利引
文、 发明人与权利人信息构造发 明人网络和权利
人网络; 通过层次标签嵌入获得标签描述的语义
特征表示, 结合层次类别结构关联性对标签语义
进行增强, 得到最终层次标签语义特征表示; 通
过文本嵌入获得专利文本特征表 示, 获得最终的
专利文本 特征; 通过网络表示学习获得网络专利
节点特征, 结合两个网络 之间的相关性增强专利
节点特征表示, 融合两个网络的专利节点特征,
获得最终的专利节点特征; 融合专利文本特征和
专利节点特征进行专利分类。 解决了忽略专利类
别标签在分类过程中的特征增强作用导致专利
分类准确性较低的技 术问题。
权利要求书5页 说明书11页 附图2页
CN 114491041 A
2022.05.13
CN 114491041 A
1.一种基于网络表示学习和层次标签嵌入的专利分类方法, 其特征在于, 应用于专利
分类, 所述方法包括:
获取并预处理专利数据, 据以获取专利文本、 专利引文、 发明人信息、 权利人信息和专
利类别标签, 其中所述专利类别标签具有层次结构且包含标签描述文本; 利用所述专利引
文、 所述发明人信息、 所述权利人信息分别构建专利 ‑发明人网络和专利 ‑权利人网络; 其
中, 所述专利 ‑发明人网络包含了专利节点之 间以及专利节 点与发明人节点之间的关系, 所
述专利‑权利人网络包含了所述专利节点之间以及所述专利节点与权利人节点之间的关
系;
通过层次标签嵌入获得所述专利类别标签的语义特征表示, 通过文本嵌入利用所述标
签描述文本获取专利类别标签的初始语义特征, 通过图卷积神经网络获取并利用所述标签
的初始语义特征和层次类别结构中的层次关联性数据, 据以增强所述专利类别标签的所述
语义特征表示, 以得到最终的专利标签特 征;
通过文本嵌入获得专利文本特征表示, 获取并利用所述专利文本特征表示与 所述专利
标签特征之间的语义关联, 据以增强所述专利文本特 征表示, 以得到最终的专利文本特 征;
对所述专利 ‑发明人网络和所述专利 ‑权利人网络进行网络表示学习, 据以分别获得所
述专利‑发明人网络及所述专利 ‑权利人网络中的专利节点特征, 获取并利用所述专利 ‑发
明人网络与所述专利 ‑权利人网络之间的关联性数据增强专利 ‑发明人网络及专利 ‑权利人
网络中的所述专利节点特征, 融合所述专利 ‑发明人网络与所述专利 ‑权利人网络中的所述
专利节点特 征, 据以获得最终的所述专利节点特 征;
融合所述最终的专利文本特征和所述最终的专利节点特征, 据以得到融合专利特征表
示, 以进行专利分类。
2.根据权利要求1所述的一种基于网络表示学习和层次标签嵌入的专利分类方法, 其
特征在于, 所述 获取并预 处理专利数据信息, 据以获取专利文本、 专利引文、 发明人信息、 权
利人信息和专利类别标签, 利用所述专利引文、 所述 发明人信息、 所述权利人信息 分别构建
专利‑发明人网络和专利 ‑权利人网络的步骤, 包括:
获取并预处理所述专利数据信息, 其中, 所述专利数据信息包括: 所述专利文本、 所述
专利引文、 所述发明人信息、 所述权利人信息和所述专利类别标签;
预处理所述专利文本、 所述专利引文、 所述发明人信息、 所述权利人信息, 据以分别构
建所述专利 ‑发明人网络和所述专利 ‑权利人网络 。
3.根据权利要求2所述的一种基于网络表示学习和层次标签嵌入的专利分类方法, 其
特征在于, 所述预处理所述专利文本、 所述专利引文、 所述发明人信息、 所述权利人信息和
所述专利类别标签, 据以构建所述专利 ‑发明人网络和所述专利 ‑权利人网络的步骤, 包括:
去除所述专利文本中的停用词数据, 据以得到专利文本数据;
根据所述专利引文、 所述发明人信 息、 所述权利人信息分别构建所述专利 ‑发明人网络
和所述专利 ‑权利人网络, 其中, 在所述专利 ‑发明人网络中, 每一节点表示一个专利或者是
一个发明人, 每条边表示所述专利与所述发明人之 间的发明关系或者是所述专利之 间的引
用关系, 在所述专利 ‑权利人网络中, 每一个节点表示一个所述专利或者是一个权利人, 每
条边表示所述专利与所述权利人之间的受让关系或者是 所述专利之间的所述引用关系。
4.根据权利要求1所述的一种基于网络表示学习和层次标签嵌入的专利分类方法, 其权 利 要 求 书 1/5 页
2
CN 114491041 A
2特征在于, 所述通过层次标签嵌入获得所述专利类别标签的语义特征表示, 通过文本嵌入
利用所述标签描述文本获取专利标签的初始语义特征, 通过图卷积神经网络获取并利用所
述标签的初始语义特征和层次类别结构中的层次关联性数据, 据以增强所述专利类别标签
的语义特 征表示, 以得到最终的专利标签特 征的步骤, 包括:
利用层次标签嵌入方法学习标签描述文本, 据以获取专利标签语义特征; 其中, 通过结
合层次标签结构信息增强专利标签 语义特征, 获得层次关联的所述专利标签 语义特征;
层次标签语义增强 阶段, 所述层次类别结构中的每一专利标签节点从上下层级的邻居
标签节点中, 以下述逻辑聚合处理所述专利标签语义特征, 据以增强所述专利类别标签的
语义特征表示, 以得到所述 最终的专利标签特 征, 该步骤 还包括:
利用所述专利类别标签构建标签的层次树形结构
其中, V表示专利标签节
点,
是从上到下的层次路径,
是
从下到上的层次路径;
通过标签依赖的先验概 率作为先验层次知识, 定义公式如下:
其中, P(Uj|Ui)表示给定标签Vi时标签Vj发生的条件概率, P(Uj∩Ui)表示标签i和标签j
同时出现的条件概 率, Ni表示训练集中标签Vi的个数;
以下述逻辑:
通过图卷积神经网络获取融合标签描 述文本和层次结构的专利标签 特征, 其中, vj表示
标签节点vk的上下级邻居标签节点。 αk.j表示标签依赖的先验概率, 作为先验层次关联知
识。 最后, 节点的隐层输出状态Sk表示标签节点vk的层次关联的标签 语义特征。
5.根据权利要求1所述的一种基于网络表示学习和层次标签嵌入的专利分类方法, 其
特征在于, 所述通过文本嵌入获得文本特征表示, 获取并利用所述专利文本特征表示与所
述专利标签特征之间的语义关联, 据以增强所述专利文本特征表示, 以得到最终的专利文
本特征的步骤, 包括:
通过文本嵌入获得所述专利文本特征表示, 其中, 通过结合专利文本与不同类别标签
之间的语义相关性对专利文本特 征表示进行增强, 获得 所述最终的专利文本特 征;
在文本特征增强 阶段, 每个专利文本特征根据下述逻辑保留与专利标签最相关的部分
特征, 据以增强所述文本特征表述数据的所述文本特征表示, 以得到所述最终的专利文本
特征:
权 利 要 求 书 2/5 页
3
CN 114491041 A
3
专利 基于网络表示学习和层次标签嵌入的专利分类方法及系统
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:40上传分享