standard library
(19)中华 人民共和国 国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210116917.2 (22)申请日 2022.02.08 (65)同一申请的已公布的文献号 申请公布号 CN 114139499 A (43)申请公布日 2022.03.04 (73)专利权人 中国电子科技 集团公司第五十四 研究所 地址 050081 河北省石家庄市桥西区中山 西路589号中国电科54所航天信息应 用技术重点实验室 (72)发明人 耿虎军 张文宝 楚博策 王梅瑞  韩长兴 高晓倩 孟楠 姜岩松  高峰 陈勇  (74)专利代理 机构 河北东尚律师事务所 13124 代理人 王文庆 曲佳颖(51)Int.Cl. G06F 40/126(2020.01) G06F 40/30(2020.01) (56)对比文件 CN 112434526 A,2021.0 3.02 CN 103607262 A,2014.02.26 KR 20190 024409 A,2019.0 3.08 审查员 宾虹 (54)发明名称 一种基于TSS编码的态势文本消息语义压缩 编码方法 (57)摘要 本发明提供一种基于TSS编码的态势文本消 息语义压缩编码方法, 属于语义态势文本消息压 缩编码领域, 根据态势文本消息中蕴含的时间要 素、 空间要素、 语义要素进行编码。 针对待压缩的 态势文本语义消息, 抽取其中的关键语义要素内 涵, 之后, 针对其中态势 语义要素, 首先根据各类 文本消息 涉及的对抗应用领域, 构建态势语义要 素编码方案库和编码方案贝叶斯决策模型, 借助 构建的编码方案选择模型对进行语义压缩编码; 针对时间语义要素, 构建两级编码策略, 分别对 时间基准与时间差值进行编码; 针对空间语义要 素, 构建多层 级空间地址语义体系, 对经纬度、 地 名等多种不同表达方式的空间语义进行空间映 射编码。 本发明可 以去除冗余数据, 减少传输数 据量。 权利要求书2页 说明书4页 附图1页 CN 114139499 B 2022.04.12 CN 114139499 B 1.一种基于TS S编码的态 势文本消息语义压缩编码方法, 其特 征在于, 包括以下 过程: 首先针对输入的语义文本消息, 构建语义消息内容要素提取框架, 对语义文本消息的 语义内涵要素进行分解; 其中, 语义内涵要素包括时间要素、 空间要素和态 势语义要素; 针对语义文本消息中的时间要素, 构建时间基准编码与时间差值编码两级编码策略, 将时间信息按照原 始时间信息表示尺度编码成指定位数的时间整数; 针对语义文本消息 中的空间要素, 基于预期空间区域内的地形地势和重要战略目标的 空间分布, 构建多层级空间地址语义体系, 将以经纬度区间表示的空间范围、 以口语地名表 示的地理 区域和以相对位置表示的空间区域进行 空间映射, 将同一区域的不同形式的空间 信息编码到同一区段, 并按照原 始信息表示形式编码成不同类型; 针对语义文本消息 中应用领域的态势语义要素, 利用先验专家知识将当前文本消息与 应用领域以及对应的编码策略进行标注关联, 构建文本信息编码方案贝叶斯语义推理模 型, 依据文本消息的应用领域, 选择对应的词组编 码方案, 将各类态势语义字段在同一应用 语义层次中进行压缩; 针对语义文本消息中的各类虚词, 结合词性、 词组长度和使用频率进行编码。 2.根据权利要求1所述的一种基于TSS编码的态势文本消息语义压缩编码方法, 其特征 在于, 针对语义文本消息中的时间要素进行编码, 包括如下步骤: (201) 将语义文本消息中的时间信息分为两个层级: 日期部分和时间部分, 其中, 时间 部分特指一天中的具体时间, 日期部分包含年、 月、 日; 日期部分和时间部分的表示方式与 语义文本消息中的表达方式保持一 致; (202) 对于包含多个时间节点的语义文本消息, 选定时间中位数的节点作为时间基准, 分别计算 其它时间点与时间基准的差值, 并对时间基准和时间差值分别进行编码; (203) 对于时间基准编码与时间差值编码, 首先根据输入的语义文本消息中的各时间 的描述尺度确定编 码长度, 然后将日期部 分与时间部分按照格林威治时间的不同时间粒度 转化为指 定位数的编 码; 最后将原始 位置的时间信息的表述方式加入到编 码序列中; 其中, 表述方式包括数字 字母组合形式、 中文 文本形式和U TC标准形式。 3.根据权利要求1所述的一种基于TSS编码的态势文本消息语义压缩编码方法, 其特征 在于, 针对语义文本消息中的空间要素进行编码, 包括如下步骤: (301) 基于地形地势、 山川 植被、 城市结构以及重要固定设施的分布, 对目标空间区域 的自然或人文地理实体的时空属性和战略属性进 行分级标识, 构建多层级空间地址语义体 系, 并作为语义文本消息中的空间信息映射基准; (302) 针对以经纬度 区间描述的空间范围, 依据描述的空间区域范围在多层级空间地 址语义体系中对应层级 描述粒度的下一级尺度, 对目标区域编码; 针对以口语地名表示的地理区域, 依据对应地名在多层级空间地址语义体系中的行政 隶属关系和地名对应历史沿用语义体系进行编码, 同时去除异地同名数据造成的歧义; 针对以相对位置表示的空间区域, 基于原始表述形式选择经纬度或者口语地名的编码 策略, 之后添加空间相对方位信息的编码。 4.根据权利要求1所述的一种基于TSS编码的态势文本消息语义压缩编码方法, 其特征 在于, 针对语义文本消息中的应用领域的态 势要素进行编码, 包括如下步骤: (401) 采用统计建模方法与字典建模方法相融合的方式, 首先分析各应用领域内不同权 利 要 求 书 1/2 页 2 CN 114139499 B 2类型文本在用词、 造句和章节方面上的格式化文本结构、 行文逻辑以及语义规范, 统计各领 域内各类词组的使用频度, 并进行哈夫曼变长编码; 然后融合各应用领域语义要素编码策 略, 得到语义要素编码方案库; (402) 基于专家先验知识, 将语义文本消息的类别属性和时空属性采用符号化聚合近 似方法进行语义化离散编码, 并进行贝叶斯语义推理, 从语义要素编码方案库中选择适用 于当前文本消息的语义要素编码策略; 其中, 类别属性包含消息类型、 消息用途、 应用领域 和消息主体, 时空属性包 含目标速度、 目标 人数和目标空间范围。 5.根据权利要求4所述的一种基于TSS编码的态势文本消息语义压缩编码方法, 其特征 在于, 步骤 (401) 中在 对各领域内各类词组进行哈夫曼变长编码时, 对于包含多字的复合词 组, 基于中文语义语用规则, 将复合词组拆解成多个简单词组语义层次上的 “组合运算 ”; 之 后, 将复合词组的编码以各简单词组的编码进行表示。权 利 要 求 书 2/2 页 3 CN 114139499 B 3

PDF文档 专利 一种基于TSS编码的态势文本消息语义压缩编码方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于TSS编码的态势文本消息语义压缩编码方法 第 1 页 专利 一种基于TSS编码的态势文本消息语义压缩编码方法 第 2 页 专利 一种基于TSS编码的态势文本消息语义压缩编码方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:38上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。