专利 基于网络表示学习和层次标签嵌入的专利分类方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210105810.8 (22)申请日 2022.01.28 (71)申请人安徽大学地址 230039 安徽省合肥市蜀山区肥西路3 号 (72)发明人赵姝　鲁凡　陈嘉琳　陈洁　段震　钱付兰　张宇航　 (74)专利代理机构合肥市浩智运专利代理事务所(普通合伙) 34124 专利代理师朱文振 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06Q 50/18(2012.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于网络表示学习和层次标签嵌入的专利分类方法及系统 (57)摘要本发明提供一种基于网络表示学习和层次标签嵌入的专利分类方法及系统，方法包括：获取包含类别标签等数据的专利信息；利用专利引文、发明人与权利人信息构造发明人网络和权利人网络；通过层次标签嵌入获得标签描述的语义特征表示，结合层次类别结构关联性对标签语义进行增强，得到最终层次标签语义特征表示；通过文本嵌入获得专利文本特征表示，获得最终的专利文本特征；通过网络表示学习获得网络专利节点特征，结合两个网络之间的相关性增强专利节点特征表示，融合两个网络的专利节点特征，获得最终的专利节点特征；融合专利文本特征和专利节点特征进行专利分类。解决了忽略专利类别标签在分类过程中的特征增强作用导致专利分类准确性较低的技术问题。权利要求书5页说明书11页附图2页 CN 114491041 A 2022.05.13 CN 114491041 A 1.一种基于网络表示学习和层次标签嵌入的专利分类方法，其特征在于，应用于专利分类，所述方法包括：获取并预处理专利数据，据以获取专利文本、专利引文、发明人信息、权利人信息和专利类别标签，其中所述专利类别标签具有层次结构且包含标签描述文本；利用所述专利引文、所述发明人信息、所述权利人信息分别构建专利 ‑发明人网络和专利 ‑权利人网络；其中，所述专利 ‑发明人网络包含了专利节点之间以及专利节点与发明人节点之间的关系，所述专利‑权利人网络包含了所述专利节点之间以及所述专利节点与权利人节点之间的关系；通过层次标签嵌入获得所述专利类别标签的语义特征表示，通过文本嵌入利用所述标签描述文本获取专利类别标签的初始语义特征，通过图卷积神经网络获取并利用所述标签的初始语义特征和层次类别结构中的层次关联性数据，据以增强所述专利类别标签的所述语义特征表示，以得到最终的专利标签特征；通过文本嵌入获得专利文本特征表示，获取并利用所述专利文本特征表示与所述专利标签特征之间的语义关联，据以增强所述专利文本特征表示，以得到最终的专利文本特征；对所述专利 ‑发明人网络和所述专利 ‑权利人网络进行网络表示学习，据以分别获得所述专利‑发明人网络及所述专利 ‑权利人网络中的专利节点特征，获取并利用所述专利 ‑发明人网络与所述专利 ‑权利人网络之间的关联性数据增强专利 ‑发明人网络及专利 ‑权利人网络中的所述专利节点特征，融合所述专利 ‑发明人网络与所述专利 ‑权利人网络中的所述专利节点特征，据以获得最终的所述专利节点特征；融合所述最终的专利文本特征和所述最终的专利节点特征，据以得到融合专利特征表示，以进行专利分类。 2.根据权利要求1所述的一种基于网络表示学习和层次标签嵌入的专利分类方法，其特征在于，所述获取并预处理专利数据信息，据以获取专利文本、专利引文、发明人信息、权利人信息和专利类别标签，利用所述专利引文、所述发明人信息、所述权利人信息分别构建专利‑发明人网络和专利 ‑权利人网络的步骤，包括：获取并预处理所述专利数据信息，其中，所述专利数据信息包括：所述专利文本、所述专利引文、所述发明人信息、所述权利人信息和所述专利类别标签；预处理所述专利文本、所述专利引文、所述发明人信息、所述权利人信息，据以分别构建所述专利 ‑发明人网络和所述专利 ‑权利人网络。 3.根据权利要求2所述的一种基于网络表示学习和层次标签嵌入的专利分类方法，其特征在于，所述预处理所述专利文本、所述专利引文、所述发明人信息、所述权利人信息和所述专利类别标签，据以构建所述专利 ‑发明人网络和所述专利 ‑权利人网络的步骤，包括：去除所述专利文本中的停用词数据，据以得到专利文本数据；根据所述专利引文、所述发明人信息、所述权利人信息分别构建所述专利 ‑发明人网络和所述专利 ‑权利人网络，其中，在所述专利 ‑发明人网络中，每一节点表示一个专利或者是一个发明人，每条边表示所述专利与所述发明人之间的发明关系或者是所述专利之间的引用关系，在所述专利 ‑权利人网络中，每一个节点表示一个所述专利或者是一个权利人，每条边表示所述专利与所述权利人之间的受让关系或者是所述专利之间的所述引用关系。 4.根据权利要求1所述的一种基于网络表示学习和层次标签嵌入的专利分类方法，其权　利　要　求　书 1/5 页 2 CN 114491041 A 2特征在于，所述通过层次标签嵌入获得所述专利类别标签的语义特征表示，通过文本嵌入利用所述标签描述文本获取专利标签的初始语义特征，通过图卷积神经网络获取并利用所述标签的初始语义特征和层次类别结构中的层次关联性数据，据以增强所述专利类别标签的语义特征表示，以得到最终的专利标签特征的步骤，包括：利用层次标签嵌入方法学习标签描述文本，据以获取专利标签语义特征；其中，通过结合层次标签结构信息增强专利标签语义特征，获得层次关联的所述专利标签语义特征；层次标签语义增强阶段，所述层次类别结构中的每一专利标签节点从上下层级的邻居标签节点中，以下述逻辑聚合处理所述专利标签语义特征，据以增强所述专利类别标签的语义特征表示，以得到所述最终的专利标签特征，该步骤还包括：利用所述专利类别标签构建标签的层次树形结构其中， V表示专利标签节点，是从上到下的层次路径，是从下到上的层次路径；通过标签依赖的先验概率作为先验层次知识，定义公式如下：其中， P(Uj|Ui)表示给定标签Vi时标签Vj发生的条件概率， P(Uj∩Ui)表示标签i和标签j 同时出现的条件概率， Ni表示训练集中标签Vi的个数；以下述逻辑：通过图卷积神经网络获取融合标签描述文本和层次结构的专利标签特征，其中， vj表示标签节点vk的上下级邻居标签节点。 αk.j表示标签依赖的先验概率，作为先验层次关联知识。最后，节点的隐层输出状态Sk表示标签节点vk的层次关联的标签语义特征。 5.根据权利要求1所述的一种基于网络表示学习和层次标签嵌入的专利分类方法，其特征在于，所述通过文本嵌入获得文本特征表示，获取并利用所述专利文本特征表示与所述专利标签特征之间的语义关联，据以增强所述专利文本特征表示，以得到最终的专利文本特征的步骤，包括：通过文本嵌入获得所述专利文本特征表示，其中，通过结合专利文本与不同类别标签之间的语义相关性对专利文本特征表示进行增强，获得所述最终的专利文本特征；在文本特征增强阶段，每个专利文本特征根据下述逻辑保留与专利标签最相关的部分特征，据以增强所述文本特征表述数据的所述文本特征表示，以得到所述最终的专利文本特征：权　利　要　求　书 2/5 页 3 CN 114491041 A 3

专利 基于网络表示学习和层次标签嵌入的专利分类方法及系统

专利基于网络表示学习和层次标签嵌入的专利分类方法及系统