(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211266801.3 (22)申请日 2022.10.17 (71)申请人 上海城建职业学院 地址 200438 上海市杨 浦区军工路23 60号 (72)发明人 贾思远 孙文龙  (74)专利代理 机构 北京鑫知翼知识产权代理事 务所(普通 合伙) 11984 专利代理师 孙长江 (51)Int.Cl. G10L 15/26(2006.01) G10L 15/06(2013.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 小学作文语音识别文本纠错系统及方法 (57)摘要 本发明涉及一种小学作文语音识别文本纠 错系统及方法, 包括如下步骤: 选择目标小学作 文训练语料, 将选择的目标小学作文训练语料按 照句子分成长度小于512字的短句; 使用语音合 成服务, 分别按照男童音和女童音生成相应的语 音文件; 将语音作为模型输入、 文本作为模型输 出, 对语料进行自适应训练下的微调; 根据训练 后的深度模 型推断小学作文语音的文本。 本发明 主要解决小学生在写作文 过程中, 遇到不会书写 的汉字时, 通过说出想写的句子, 系统会自动快 速的提供正确的书写模式, 作为参考, 帮助学生 完成作文的写作。 权利要求书2页 说明书13页 附图3页 CN 115547334 A 2022.12.30 CN 115547334 A 1.小学作文语音识别文本纠错方法, 其特 征在于, 包括如下步骤: S1.选择目标小学作文训练语料, 将选择的目标小学作文训练语料按照句子分成长度 小于512字的短句; S2.使用语音合成服 务, 分别按照男童音和女童音生成相应的语音 文件; S3.将语音作为模型输入、 文本作为模型输出, 对语料进行自适应训练下的微调; S4.根据训练后的深度模型推断小学作文语音的文本 。 2.根据权利要求1所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S1中, 具 体包括步骤: 首先加载相关Python模型, 然后 分别加载每一篇小学作文文本, 加载完成后, 对所有文本按照句子进行分割, 获得每段文本的字数, 筛选出字数在1 ‑512之间的文本, 并 保存为文本 。 3.根据权利要求2所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S2中, 具 体包括步骤: 首先加载微软相关服务模块, 然后将文本转语音配置文件设置为中文童音, 读 取S1中筛选出的所有文本文件, 针对每一个文件使用微软的Asure服务转 成对应语音, 并按 照文本编号对语音 文件命名。 4.根据权利要求3所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S3中, 具 体包括步骤: S31.导入Transformers中语音相关的模型; S32.读取文本语料文件; S33.获取语音 文件名称; S34.将文本文件与语音 文件一一对应; S35.删除多余的字段; S36.增加全部语音的音频 数字表达; S37.获得 所有小学作文的字典表; S38.将所有样本分成训练集和验证集; S39.生成用于深度学习的DataSet; S310.加载Transformers的语音处 理程序; S311.生成适用于深度学习的训练集和验证集; S312.定义基于语音的损失函数; S313.构建基于Wav2 Vec2的Transformers模型; S314.利用Transformers的自训练模型对语音和文本进行训练。 5.根据权利要求4所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S4中, 具 体包括步骤: S41.加载Transformers的语音相关模型; S42.训练后的模型 结果; S43.加载训练后的模型 结果; S44.配置用于语音识别的模型; S45.设置分词器, 加载训练时的所有 小学作文的全部词汇; S46.设置语音处 理接口; S47.加载对应的语音 文件, 并获得 该语音文件的向量;权 利 要 求 书 1/2 页 2 CN 115547334 A 2S48.对上述语音 文件进行 预测; S49.输出对应的文本 。 6.利用权利要求5所述的小学作文语音识别文本纠错方法的纠错系统, 其特征在于, 包 括存储模块、 语音合 成模块、 语音识别模块、 训练模块、 文本输出模块, 所述存储模块用于存 储目标小 学作文训练语料文本、 短句文本、 词汇文本, 所述语音合成模块用于读取存储模块 中的文本文件, 并将其转成对应语音, 并存储, 所述语音识别模块用于接收语音输入信号, 所述训练模块用于将接收语音输入信号进 行处理和预测并对语音和文本进 行训练, 所述文 本输出模块用于根据训练模块的预测结果输出对应的文本信息 。权 利 要 求 书 2/2 页 3 CN 115547334 A 3

PDF文档 专利 小学作文语音识别文本纠错系统及方法

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 小学作文语音识别文本纠错系统及方法 第 1 页 专利 小学作文语音识别文本纠错系统及方法 第 2 页 专利 小学作文语音识别文本纠错系统及方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:33上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。