standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210032379.9 (22)申请日 2022.01.12 (71)申请人 车智互联 (北京) 科技有限公司 地址 100080 北京市海淀区丹棱 街3号B座 11层1110、 1111室 (72)发明人 雷涛 杨雷  (74)专利代理 机构 北京思睿峰知识产权代理有 限公司 1 1396 专利代理师 谢建云 赵爱军 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/205(2020.01) G06F 40/216(2020.01) G06F 40/284(2020.01) G06N 3/04(2006.01) (54)发明名称 一种文本生成模型及文本生成方法 (57)摘要 本公开公开了一种文本生成模型及文本生 成方法。 其中, 文本生成模型, 包括: 编码模块和 解码模块。 编码模块适于对输入数据进行处理, 以提取出指示其语义特征的第一向量; 解码模块 适于对第一向量进行处理, 以生成至少一个句向 量, 来组成长文本。 进一步地, 解码模块又包括: 子句内容规划单元, 与编码模块耦接, 适于接收 编码模块的输出, 对编码模块输出的第一向量进 行处理, 以确定出至少一个指示子句语义特征的 第二向量; 单词生成单元, 与子句内容规划单元 耦接, 适于对第二向量进行处理, 生成多个单词 对应的词向量, 以及, 利用词向量, 组合成至少一 个句向量, 来 生成长文本 。 权利要求书2页 说明书9页 附图3页 CN 114462419 A 2022.05.10 CN 114462419 A 1.一种解码模块, 适于布置在文本生成模型中, 与编码模块相耦接, 包括: 子句内容规划单元, 与所述编码模块耦接, 适于接收所述编码模块的输出, 对所述编码 模块输出的第一向量进行处 理, 以确定出至少一个指示子句语义特 征的第二向量; 单词生成单元, 与所述子句内容规划单元耦接, 适于对所述第二向量进行处理, 生成多 个单词对应的词向量, 以及, 利用所述词向量, 组合成至少一个句向量, 来 生成长文本 。 2.如权利要求1所述的解码模块, 其中, 所述单词生成单 元还适于, 在每个时间步进行束搜索, 得到各句向量的概 率值; 按照概率值从大到小的顺序, 依序选取第一数量个句向量, 作为 候选序列; 针对所述 候选序列, 分别计算每两个句向量之间的差异值; 基于所述差异值, 重构候选序列; 重复迭代计算差异值的步骤和重构候选序列的步骤, 直至所述差异值满足预设条件 时, 确定出属于候选序列的句向量。 3.如权利要求2所述的解码模块, 其中, 所述单词生成单 元还适于, 当两个句向量的差异值大于阈值时, 从所述 候选序列中移除这两个句向量中的一个; 依序增加一个概 率值最大的句向量至候选序列, 来重构出 所述候选序列。 4.如权利要求1 ‑3中任一项所述的解码模块, 其中, 所述子句内容 规划单元还适于, 基于所述编码模块输出的第 一向量和上一 时间步所输出的子句语义特征, 确定出当前 时间步子句语义特 征的概率分布; 基于所述 概率分布, 生成指示当前时间步的所述子句语义特 征的第二向量。 5.如权利要求1 ‑4中任一项所述的解码模块, 其中, 所述子句语义特征至少包括以下特 征中的一个: 子句的实体属性、 主题特 征、 情感特 征。 6.一种文本生成模型, 包括: 编码模块, 适于对输入数据进行处 理, 以提取 出指示其语义特 征的第一向量; 如权利要求1 ‑5中任一项所述的解码模块, 与所述编码模块耦接, 适于对所述第一向量 进行处理, 以生成至少一个句向量, 来组成长文本 。 7.一种文本生成方法, 包括 步骤: 从输入数据中提取 出指示其语义特 征的第一向量; 基于所述第一向量, 确定出至少一个指示子句语义特 征的第二向量; 对所述第二向量进行处 理, 生成多个词向量; 以及 利用所述词向量, 组合成至少一个句向量, 来 生成长文本 。 8.如权利要求7所述的方法, 其中, 利用所述词向量, 组合成至少一个句向量的步骤包 括: 在每个时间步进行束搜索, 得到各句向量的概 率值; 按照概率值从大到小的顺序, 依序选取第一数量个句向量, 作为 候选序列; 针对所述 候选序列, 分别计算每两个句向量之间的差异值; 基于所述差异值, 重构候选序列; 重复迭代计算差异值的步骤和重构候选序列的步骤, 直至所述差异值满足预设条件 时, 确定出属于候选序列的句向量。 9.一种计算设备, 包括:权 利 要 求 书 1/2 页 2 CN 114462419 A 2一个或多个处 理器; 存储器; 一个或多个程序, 其中所述一个或多个程序存储在所述存储器中并被配置为由所述一 个或多个处理器执行, 所述一个或多个程序包括用于执行如权利要求7或8所述的方法的指 令。 10.一种存储一个或多个程序的计算机可读存储介质, 所述一个或多个程序包括指令, 所述指令在被 计算设备 执行时, 使得 所述计算设备 执行如权利要求7或8所述的方法。权 利 要 求 书 2/2 页 3 CN 114462419 A 3

PDF文档 专利 一种文本生成模型及文本生成方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种文本生成模型及文本生成方法 第 1 页 专利 一种文本生成模型及文本生成方法 第 2 页 专利 一种文本生成模型及文本生成方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。