文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211266801.3 (22)申请日 2022.10.17 (71)申请人 上海城建职业学院 地址 200438 上海市杨 浦区军工路23 60号 (72)发明人 贾思远 孙文龙 (74)专利代理 机构 北京鑫知翼知识产权代理事 务所(普通 合伙) 11984 专利代理师 孙长江 (51)Int.Cl. G10L 15/26(2006.01) G10L 15/06(2013.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 小学作文语音识别文本纠错系统及方法 (57)摘要 本发明涉及一种小学作文语音识别文本纠 错系统及方法, 包括如下步骤: 选择目标小学作 文训练语料, 将选择的目标小学作文训练语料按 照句子分成长度小于512字的短句; 使用语音合 成服务, 分别按照男童音和女童音生成相应的语 音文件; 将语音作为模型输入、 文本作为模型输 出, 对语料进行自适应训练下的微调; 根据训练 后的深度模 型推断小学作文语音的文本。 本发明 主要解决小学生在写作文 过程中, 遇到不会书写 的汉字时, 通过说出想写的句子, 系统会自动快 速的提供正确的书写模式, 作为参考, 帮助学生 完成作文的写作。 权利要求书2页 说明书13页 附图3页 CN 115547334 A 2022.12.30 CN 115547334 A 1.小学作文语音识别文本纠错方法, 其特 征在于, 包括如下步骤: S1.选择目标小学作文训练语料, 将选择的目标小学作文训练语料按照句子分成长度 小于512字的短句; S2.使用语音合成服 务, 分别按照男童音和女童音生成相应的语音 文件; S3.将语音作为模型输入、 文本作为模型输出, 对语料进行自适应训练下的微调; S4.根据训练后的深度模型推断小学作文语音的文本 。 2.根据权利要求1所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S1中, 具 体包括步骤: 首先加载相关Python模型, 然后 分别加载每一篇小学作文文本, 加载完成后, 对所有文本按照句子进行分割, 获得每段文本的字数, 筛选出字数在1 ‑512之间的文本, 并 保存为文本 。 3.根据权利要求2所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S2中, 具 体包括步骤: 首先加载微软相关服务模块, 然后将文本转语音配置文件设置为中文童音, 读 取S1中筛选出的所有文本文件, 针对每一个文件使用微软的Asure服务转 成对应语音, 并按 照文本编号对语音 文件命名。 4.根据权利要求3所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S3中, 具 体包括步骤: S31.导入Transformers中语音相关的模型; S32.读取文本语料文件; S33.获取语音 文件名称; S34.将文本文件与语音 文件一一对应; S35.删除多余的字段; S36.增加全部语音的音频 数字表达; S37.获得 所有小学作文的字典表; S38.将所有样本分成训练集和验证集; S39.生成用于深度学习的DataSet; S310.加载Transformers的语音处 理程序; S311.生成适用于深度学习的训练集和验证集; S312.定义基于语音的损失函数; S313.构建基于Wav2 Vec2的Transformers模型; S314.利用Transformers的自训练模型对语音和文本进行训练。 5.根据权利要求4所述的小学作文语音识别文本纠 错方法, 其特征在于, 所述S4中, 具 体包括步骤: S41.加载Transformers的语音相关模型; S42.训练后的模型 结果; S43.加载训练后的模型 结果; S44.配置用于语音识别的模型; S45.设置分词器, 加载训练时的所有 小学作文的全部词汇; S46.设置语音处 理接口; S47.加载对应的语音 文件, 并获得 该语音文件的向量;权 利 要 求 书 1/2 页 2 CN 115547334 A 2S48.对上述语音 文件进行 预测; S49.输出对应的文本 。 6.利用权利要求5所述的小学作文语音识别文本纠错方法的纠错系统, 其特征在于, 包 括存储模块、 语音合 成模块、 语音识别模块、 训练模块、 文本输出模块, 所述存储模块用于存 储目标小 学作文训练语料文本、 短句文本、 词汇文本, 所述语音合成模块用于读取存储模块 中的文本文件, 并将其转成对应语音, 并存储, 所述语音识别模块用于接收语音输入信号, 所述训练模块用于将接收语音输入信号进 行处理和预测并对语音和文本进 行训练, 所述文 本输出模块用于根据训练模块的预测结果输出对应的文本信息 。权 利 要 求 书 2/2 页 3 CN 115547334 A 3
专利 小学作文语音识别文本纠错系统及方法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:24:33
上传分享
举报
下载
原文档
(660.9 KB)
分享
友情链接
GB-T 4622.1-2022 管法兰用缠绕式垫片 第1部分:PN系列.pdf
GA-T 766-2020 人精液PSA检测 金标试剂条法.pdf
GB-T 18916.1-2021 取水定额 第1部分:火力发电.pdf
GB-T 32746-2016 岩土工程仪器信号与接口.pdf
GB-T 13734-2008 耳穴名称与定位.pdf
GB-T 40873-2021 大洋富钴结壳资源勘查规程.pdf
SANS 应急响应处理手册 incident-handlers-handbook 英文版.pdf
GB-T 26471-2023 塔式起重机 安装、拆卸与爬升规则.pdf
DB21-T 3722.1—2023 高标准农田建设指南 第1部分:项目初步设计报告编制 辽宁省.pdf
GB-T 43836-2024 企业科技创新系统能力水平评价规范.pdf
360 新一代XDR-面向未来的数字安全防御架构.pdf
GB-T 32918.2-2016 信息安全技术 SM2椭圆曲线公钥密码算法 第2部分:数字签名算法.pdf
GB-T 28827.6-2019 信息技术服务 运行维护 第6部分:应用系统服务要求.pdf
炼石数据安全方案-60页通用行业-V7.4.2.pdf
GB-T 8567-2006 计算机软件文档编制规范.pdf
DB11- 381-2016 既有居住建筑节能改造技术规程 北京市.pdf
GB-T 25173-2010 水域纳污能力计算规程.pdf
GB-T 34116-2017 智能电网用户自动需求响应 分散式空调系统终端技术条件.pdf
GB-T 37046-2018 信息安全技术 灾难恢复服务能力评估准则.pdf
DB52-T 1034-2019 压缩天然气车用气瓶充装安全管理规范 贵州省.pdf
1
/
19
评价文档
赞助2元 点击下载(660.9 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。