standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210099074.X (22)申请日 2022.01.27 (71)申请人 启明信息技 术股份有限公司 地址 130117 吉林省长 春市长春净月高新 技术产业开发区百合 街1009号 (72)发明人 杜阿卫 刘珍茹  (74)专利代理 机构 成都金英专利代理事务所 (普通合伙) 51218 专利代理师 詹权松 (51)Int.Cl. G06F 16/25(2019.01) G06F 16/33(2019.01) G06F 40/30(2020.01) G06N 3/08(2006.01) (54)发明名称 一种汽车舆情 情感分析方法 (57)摘要 本发明公开了一种汽 车舆情情感分析方法, 包括以下步骤: S1: 采集并整理指定汽车品牌的 基础数据; S2: 对采集得到的基础数据进行处理, 清除其中的垃圾信息, 得到最终有用数据; S3: 对 有用数据进行剖析分类, 根据判断规则标注正中 负向语料; S4: 生成语料库; S5: 进行环境搭建与 参数配置, 进行数据处理和句向量转换; S6: 搭建 神经网络和预处理模型; S7: 进行模型训练和优 化, 得出最优模型; S8: 通过最优模型对文 章进行 情感分析, 若是负向情感, 则判断出负向预警程 度。 本发明可 以筛选掉海量的无效信息, 采用私 有化定制模 型, 可以更精准的查找到汽车领域的 关键信息 。 权利要求书2页 说明书7页 附图1页 CN 114547167 A 2022.05.27 CN 114547167 A 1.一种汽车舆情 情感分析 方法, 其特 征在于, 具体包括以下步骤: S1: 采集并整理指定汽车品牌的基础数据; S2: 对采集得到的基础数据进行处 理, 清除其中的垃圾信息, 得到最终有用数据; S3: 对有用数据进行剖析分类, 根据判断规则标注正中负向语料; S4: 生成语料库; S5: 进行环境搭建与参数配置, 进行 数据处理和句向量 转换; S6: 搭建神经网络和预处 理模型; S7: 进行模型训练和优化, 得 出最优模型; S8: 通过最优 模型对文章进行情感分析, 若是负向情感, 则判断出负向预警程度。 2.如权利要求1所述的一种汽车舆情情 感分析方法, 其特征在于, 所述S1具体包括以下 子步骤: S11: 通过多渠道进行基础数据采集, 所述多渠道包括: 新闻文章、 论坛贴吧及网络视 频; S12: 对S11中采集的基础数据进行ETL程序清洗转换, 将清洗转换之后的数据存储在多 维分析数据库中; S13: 根据汽车性质制作汽车等级信 息表, 根据汽车特征信 息和汽车企业信息制作汽车 特征记录表和汽车企业登记 表。 3.如权利要求1所述的一种汽车舆情情 感分析方法, 其特征在于, 所述S2具体包括以下 子步骤: S21: 网络渠道清洗: 判断网络渠道是否与汽车等级信息表想对应, 若是, 则保留, 若否, 则对其进行 垃圾信息清除; S22: 数据标题清洗: 根据数据标题与汽车等级信息表、 汽车特征记录表和汽车企业登 记表的相关度进行 垃圾信息清除; S23: 进行文章查漏: 对文章内容进行查找, 判断文章内容与汽车等级信息表的相关度, 设置相关度阈值, 若大于该阈值, 则保留文章内容, 若否, 则对其进行 垃圾信息清除。 4.如权利要求1所述的一种汽车舆情情 感分析方法, 其特征在于, 所述S3 中根据判断规 则标注正中负向语料具体包括: 文章类型判断规则、 论坛类型判断规则及音视频类型判断 规则。 5.如权利要求1所述的一种汽车舆情情 感分析方法, 其特征在于, 所述S4中语料库为结 构性数据存储系统, 其包括: 文章ID、 内容、 地址、 正负向类别, 同时可关联得到获取时间、 发 布时间、 媒体渠道及文章热度。 6.如权利要求1所述的一种汽车舆情情 感分析方法, 其特征在于, 所述S5具体包括以下 子步骤: S51: 配置通用参数的路径; S52: 读取 数据, 对数据进行 预处理, 去掉标点与停用词; S53: 用bert做句向量 转换, 将每条 数据向量压缩成一维; S54: 句向量压缩好后, 将数据进行按比例分组, 分成: 训练数据、 测试 数据及预测数据。 7.如权利要求1所述的一种汽车舆情情 感分析方法, 其特征在于, 所述S6 中搭建神经网 络为Bilstm网络, 其具体包括以下子步骤:权 利 要 求 书 1/2 页 2 CN 114547167 A 2S61: 利用tensorfl ow搭建神经网络基础架构; S62: 采用Adam进行优化 算法的设计; S63: 利用sparse_categorical_cros sentropy进行损失函数设计; S64: 构建评价指标, 选用综合 准确率和召回率的F1 ‑score作为评价标准。 8.如权利要求1所述的一种汽车舆情情 感分析方法, 其特征在于, 所述S6 中搭建预处理 模型包括以下子步骤: S65: 进行超参数设置, 将学习率和batc h‑size加载到配置文件中; S66: 将搭建好的神经网络加载进预处 理模型中, 配置初始化权 重。 9.如权利要求1所述的一种汽车舆情情 感分析方法, 其特征在于, 所述S7中模型训练 的 训练环境 为gpu。 10.如权利要求1所述的一种汽车舆情情感分析方法, 其特征在于, 所述S7中对模型进 行数据质量、 数量、 模型框架及算法上的优化。权 利 要 求 书 2/2 页 3 CN 114547167 A 3

PDF文档 专利 一种汽车舆情情感分析方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种汽车舆情情感分析方法 第 1 页 专利 一种汽车舆情情感分析方法 第 2 页 专利 一种汽车舆情情感分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:41上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。