standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210134797.9 (22)申请日 2022.02.14 (71)申请人 北京中交兴 路信息科技有限公司 地址 100176 北京市海淀区东北旺西路8号 中关村软件园27号院千方大厦A座 (72)发明人 赵岩 蔡抒扬 夏曙东 孙智彬  张志平  (74)专利代理 机构 北京辰权知识产权代理有限 公司 11619 专利代理师 李小朋 (51)Int.Cl. G06F 16/33(2019.01) G06F 40/194(2020.01) G06F 40/30(2020.01) G06F 17/16(2006.01) (54)发明名称 物流行业词向量矩阵构建方法、 装置、 存储 介质及电子设备 (57)摘要 本发明公开了一种物流行业词向量矩阵构 建方法、 装置、 存储介质及电子设备, 方法包括: 根据车辆停靠点数据和企业围栏数据构建围栏 序列和企业上下游关系图; 构建围栏序列中每个 围栏的词向量; 根据企业上下游关系图生成每个 企业的多组上下文词汇; 从每个围栏的词向量映 射出每个企业的多组上下文词汇中每组上下文 词汇对应的目标词向量; 基于每组上下文词汇对 应的目标词向量进行模型训练, 生成物流行业词 向量矩阵。 由于本申请通过构建企业上下游关 系, 进而构建企业标签中词汇的语义关系, 通过 自然语言处理的手段, 生 成物流词汇特有的语义 向量表示, 从而更好的计算物 流词汇间的相似度 以及用相应词汇表征的实体的相似度, 同时提高 了语义表征的准确度。 权利要求书2页 说明书9页 附图4页 CN 114595307 A 2022.06.07 CN 114595307 A 1.一种物流行业词向量矩阵构建方法, 其特 征在于, 所述方法包括: 根据车辆停靠点数据和企业围栏数据构建围栏序列和企业上 下游关系图; 构建所述围栏序列中每 个围栏的词向量; 根据所述企业上 下游关系图生成每 个企业的多组上 下文词汇; 从所述每个围栏的词向量映射出所述每个企业的多组上下文词汇中每组上下文词汇 对应的目标词向量; 基于所述每组上下文词汇对应的目标词向量进行模型训练, 生成物流行业词向量矩 阵。 2.根据权利要求1所述的方法, 其特征在于, 所述根据车辆停靠点数据和企业围栏数据 构建围栏序列和企业上 下游关系图, 包括: 获取车辆停靠点数据和企业围栏数据; 关联所述车辆停靠点数据和所述企业围栏数据, 以将所述车辆停靠点数据转换为围栏 序列; 根据所述围栏序列生成企业上 下游关系图。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述围栏序列生成企业上下游关 系图, 包括: 确定所述围栏序列中相邻围栏间的关系, 生成关系图; 识别所述关系图中的相同关系和关系数量小于预设阈值的关系; 将所述相同关系进行归并, 并将关系数量小于预设阈值的关系进行剔除, 得到企业上 下游关系图。 4.根据权利要求1所述的方法, 其特征在于, 所述构建所述围栏序列中每个围栏的词向 量, 包括: 根据所述围栏序列中每个围栏对应的企业实体的词汇, 确定所述企业实体对应的兴趣 点类型标签和货物类型 标签; 从预设词向量空间中匹配出 所述兴趣点类型 标签和货物标签中各词汇的初始向量; 将所述兴趣点类型标签和货物标签中各词汇的初始向量进行融合, 生成每个围栏的词 向量。 5.根据权利要求1所述的方法, 其特征在于, 所述根据所述企业上下游关系图生成每个 企业的多组词汇, 包括: 对所述企业上下游关系图中各个企业节点按上下游方向进行广度搜索, 得到每个企业 的深度树; 根据所述每个企业的深度树中根节点到叶节点的每条路径, 分别确定每条路径对应的 词汇上下文关系; 将每个所述词汇上下文关系上的词汇进行排列组合, 生成每个企业的多组上下文词 汇。 6.根据权利要求1所述的方法, 其特征在于, 所述基于所述每组词汇对应的目标词向量 进行模型训练后, 生成物流行业词向量矩阵, 包括: 将所述每组上 下文词汇对应的目标词向量输入预设词嵌入 模型中, 输出多个目标值; 根据所述多个目标值 生成物流行业词向量矩阵。权 利 要 求 书 1/2 页 2 CN 114595307 A 27.根据权利要求6所述的方法, 其特征在于, 所述根据所述多个目标值生成物流行业词 向量矩阵, 包括: 将所述多个目标值做和, 生成模型损失值; 当所述模型损失值到 达预设阈值时, 输出 所述词嵌入训练模型中间层的参数矩阵; 将所述中间层的参数矩阵确定为物流行业词向量矩阵。 8.一种物流行业词向量矩阵构建装置, 其特 征在于, 所述装置包括: 数据构建模块, 用于根据车辆停靠点数据和企业围栏数据构建 围栏序列和企业上下游 关系图; 词向量构建模块, 用于构建所述围栏序列中每 个围栏的词向量; 词汇生成模块, 用于根据所述企业上 下游关系图生成每 个企业的多组上 下文词汇; 词向量映射模块, 用于从所述每个围栏的词向量映射出所述每个企业的多组上下文词 汇中每组上 下文词汇对应的目标词向量; 词向量矩阵生成模块, 用于基于所述每组上下文词汇对应的目标词向量进行模型训 练, 生成物流行业词向量矩阵。 9.一种计算机存储介质, 其特征在于, 所述计算机存储介质存储有多条指令, 所述指令 适于由处 理器加载并执 行如权利要求1 ‑7任意一项的方法步骤。 10.一种电子设备, 其特征在于, 包括: 处理器和存储器; 其中, 所述存储器存储有计算 机程序, 所述计算机程序适于由所述处理器加载并执行如权利要求1 ‑7任意一项的方法步 骤。权 利 要 求 书 2/2 页 3 CN 114595307 A 3

PDF文档 专利 物流行业词向量矩阵构建方法、装置、存储介质及电子设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 物流行业词向量矩阵构建方法、装置、存储介质及电子设备 第 1 页 专利 物流行业词向量矩阵构建方法、装置、存储介质及电子设备 第 2 页 专利 物流行业词向量矩阵构建方法、装置、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:36上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。