(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211092559.2 (22)申请日 2022.09.08 (71)申请人 北京星天地信息科技有限公司 地址 102200 北京市昌平区科技园区昌盛 路18号A2号楼3层3 06-311室 (72)发明人 李健 吴琳 李建兵 余优生  李靖 温立文 贾延青 袁金国  (74)专利代理 机构 北京三聚阳光知识产权代理 有限公司 1 1250 专利代理师 王娜 (51)Int.Cl. G06F 16/35(2019.01) G06N 3/04(2006.01) G06F 16/332(2019.01) G06F 40/289(2020.01)G06Q 50/18(2012.01) G06Q 50/26(2012.01) (54)发明名称 警情信息处理方法和装置、 电子设备和存储 介质 (57)摘要 本申请提供了一种警情信息处理方法和装 置、 电子设备和存储介质, 其中, 该方法包括: 获 取待分类的警情信息; 将警情信息进行向量化处 理, 得到对应的数字向量; 将数字向量输入警情 分类模型, 得到分类结果, 其中, 分类结果包含第 一预设数量个预测类型; 根据分类结果, 分别获 取每个预测类型对应的法律信息, 并将法律信息 发送至用户终端。 通过本申请, 解决了相关技术 中存在分类方法复杂、 分类精度低以及无法针对 分类结果提供对应的类似案例、 适用法条、 处置 规范等信息的问题。 权利要求书2页 说明书12页 附图3页 CN 115168594 A 2022.10.11 CN 115168594 A 1.一种警情信息处 理方法, 其特 征在于, 所述方法包括: 获取待分类的警情信息; 将所述警情信息进行向量 化处理, 得到对应的数字向量; 将所述数字向量输入警情分类模型, 得到分类结果, 其中, 所述分类结果包含第 一预设 数量个预测类型; 根据所述分类结果, 分别获取每个所述预测类型对应的法律信息, 并将所述法律信息 发送至用户终端。 2.根据权利要求1所述的方法, 其特征在于, 在所述将所述数字向量输入警情分类模 型, 得到分类结果之前, 所述方法还 包括: 获取历史警情数据集, 其中, 所述历史警情数据集包含第 二预设数量个历史案件信 息, 所述历史案件信息包 含历史警情信息、 历史分类结果; 对所述历史警情信息进行向量化处理, 得到历史数字向量, 并把所述历史数字向量存 入所述历史警情数据集, 得到更新后的历史警情数据集; 从所述更新后的历史警情数据集中获取训练集, 其中, 所述训练集包含第三预设数量 个所述历史案件信息以及对应的所述历史数字向量; 将所述训练集中的所述历史数字向量输入训练模型, 得到对应的预测分类结果, 更新 所述训练模型的模型参数, 直到每个所述预测分类结果包含所述历史分类结果的概率都大 于对应的预设分类阈值, 则训练完成, 得到所述警情分类模型, 其中, 所述预设分类阈值用 于指示每 个历史案件信息所属类别的临界值。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述分类结果, 分别获取每个所 述预测类型对应的法律信息包括: 根据所述分类结果从所述历史警情数据集中获取与所述警情信息匹配的历史案件信 息; 根据所述警情信息通过搜索引擎获取法律条文以及对应解释; 将所述历史案件信息、 所述法律条文以及对应解释作为所述法律信息发送至用户终 端。 4.根据权利要求2所述的方法, 其特征在于, 在所述将所述训练集中的所述历史数字向 量输入训练模型, 得到对应的预测分类结果之后, 所述方法还 包括: 从所述更新后的历史警情数据集中获取测试集, 其中, 所述测试集包含第 四预设数量 个所述历史案件信息以及对应的所述历史数字向量; 将所述测试集中的所述历史数字向量输入所述警情分类模型, 分别得到对应的测试分 类结果; 将包含所述历史分类结果的所述测试分类结果作为正确结果, 并生成所有所述正确结 果的正确数量; 将所述正确数量与所述第四预设数量的比值作为所述警情分类模型的正确率。 5.根据权利要求2所述的方法, 其特征在于, 在所述将所述训练集中的所述历史数字向 量输入训练模型, 得到对应的预测分类结果之前, 所述方法还 包括: 获取所述历史警情数据集中所有所述历史分类结果的类型; 利用目标编码分别表示所述类型, 得到编码数据, 其中, 所述目标编码的位数与所有所权 利 要 求 书 1/2 页 2 CN 115168594 A 2述类型的总数相等, 且每 个所述目标编码仅表征一种所述类型; 将所述编码数据输入所述训练模型。 6.根据权利要求2所述的方法, 其特征在于, 所述对所述历史警情信息进行向量化处 理, 得到历史数字向量包括: 将所有所述历史警情信息进行 预处理, 得到对应的历史分词信息; 根据词汇 表索引号将所述历史分词信息向量 化, 得到初始数字向量; 将所述初始数字向量扩充至预设长度, 得到所述历史数字向量。 7.根据权利要求6所述的方法, 其特征在于, 在所述根据词汇表索引号将所述历史分词 信息向量 化之前, 所述方法还 包括: 将所述历史分词信息中的词拆分, 并按照单个字出现次数由大到小的顺序进行排序, 得到字列表; 从所述字列表中选取第五预设数量个字生成初始词汇 表, 得到剩余字列表; 从所述剩余字列表中选取所有处于预设字列表中的字存入所述初始词汇表, 得到所述 词汇表, 其中, 所述预设字列表包 含第六预设数量个需要保留的字; 根据预设顺序生成与所述词汇 表中字对应的所述词汇 表索引号。 8.一种警情信息处 理装置, 其特 征在于, 包括: 第一获取模块, 用于获取待分类的警情信息; 向量化模块, 用于将所述警情信息进行向量 化处理, 得到对应的数字向量; 得到模块, 用于将所述数字向量输入警情分类模型, 得到分类结果, 其中, 所述分类结 果包含第一预设数量个预测类型; 第二获取模块, 用于根据 所述分类结果, 分别获取每个所述预测类型对应的法律信 息, 并将所述法律信息发送至用户终端。 9.一种电子设备, 包括处理器、 通信接口、 存储器和通信总线, 其中, 所述处理器、 所述 通信接口和所述存 储器通过 所述通信总线完成相互间的通信, 其特 征在于, 所述存储器, 用于存 储计算机程序; 所述处理器, 用于通过运行所述存储器上所存储的所述计算机程序来执行权利要求1 至7中任一项中所述的方法步骤。 10.一种计算机可读的存储介质, 其特征在于, 所述存储介质中存储有计算机程序, 其 中, 所述计算机程序被处 理器执行时实现权利要求1至7中任一项中所述的方法步骤。权 利 要 求 书 2/2 页 3 CN 115168594 A 3

.PDF文档 专利 警情信息处理方法和装置、电子设备和存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 警情信息处理方法和装置、电子设备和存储介质 第 1 页 专利 警情信息处理方法和装置、电子设备和存储介质 第 2 页 专利 警情信息处理方法和装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:16:06上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。