(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211271193.5 (22)申请日 2022.10.17 (71)申请人 重庆大学附属肿瘤医院 地址 400030 重庆市沙坪坝区汉渝路181号 (72)发明人 郎廷元 杨牧垚 周琦 李蕴哲  杨玲玲 崔晨曦 邹冬玲 王冬  (74)专利代理 机构 重庆航图知识产权代理事务 所(普通合伙) 50247 专利代理师 王贵君 (51)Int.Cl. C12Q 1/6886(2018.01) G16H 50/30(2018.01) G16B 40/00(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 基于深度神经网络的卵巢癌生存预后预测 分子模型的建立方法及其应用 (57)摘要 本发明公开了基于深度神经网络的卵巢癌 生存预后预测分子模型的建立方法及其应用, 以 TCGA数据库中卵巢癌样本RNA测序数据经预处理 后的数据作为模型训练和验证的数据; 以通过 Kaplan‑Meier、 Cox ‑PH和ROC分析方法鉴定的生 存相关特征经K ‑means聚类结果衡量最终选择的 13种基因在卵巢癌样本中的mRNA表达 水平; 以深 度神经网络(Deep  neural network, DNN)算法训 练, 用于单样本预测的整合模块, 以HNRPLL基因 为内参和预处理过程中的参数制定而成, 该模型 能够预测3年和5年生存率, 并且准确度高, 因此 能够用于卵巢癌生存预后预测。 权利要求书2页 说明书5页 附图6页 CN 115537467 A 2022.12.30 CN 115537467 A 1.13个基因标志物在建立基于深度神经网络的卵巢癌生存预后预测分子模型中的应 用, 其特征在于: 所述13个基因标志物为 分别为: SLC44A 5、 AGR2、 TEX2 61、 HBP1、 NUMB、 ZNF76、 ADIPOR2、 MARC HF9、 GTF2IRD1P1、 CO G5、 APMAP、 G OLT1B、 LYVE1。 2.根据权利要求1所述的应用, 其特征在于: 所述预测分子模型还包括检测13个基因标 志物表达量的试剂。 3.根据权利要求1所述的应用, 其特征在于: 所述预测分子模型以13个基因在卵 巢癌样 本中的表达水平 为数据, 以深度神经网络为算法, 训练集和测试集的分割比例为8:2, 通过5 折交叉验证获取最优超参数, 超参数分别为: 网络第一层: Neurons  number=200, Activation=Relu, Dropout=0.2; 网络第二层: Neurons  number=100, Activation= Tanh, Dropout=0.2; 网络第三层: Neurons  number=3, Activation=Softmax, Dropout= 0.2, 经测试集测试通过的模型为初始训练模 型, 初始训练模型整合单样 本数据转换模块后 为得到预测分子模型。 4.根据权利要求1所述的应用, 其特 征在于: 所述单样本数据的转换公式: 5.根据权利要求 4所述的应用, 其特 征在于: 所述内参基因为HNRPL L基因。 6.根据权利要求1~5任一项所述的应用, 其特征在于: 所述预测分子模型的预测结果 为以下三种: 1)生存能力强, 3年 生存率10 0%, 5年生存率90%; 2)生存能力中, 3年 生存率90%, 5年 生存率50%; 3)生存能力低, 3年 生存率40%, 5年 生存率18%。 7.基于深度神经网络的卵巢癌生存预后预测分子模型的建立方法, 其特征在于: 包括 如下步骤: (1)以TCGA数据库 中284个卵巢癌样本的mRNA测序数据经预处理后的数据作为模型开 发所用数据; (2)利用K邻近缺失值填充方法填充数据中的缺失值, 再以Quantile标准化方法对数据 进行标准化处理, 再以Z ‑score缩放方法对数据进行缩放, 完成数据的预处 理; (3)项目利用以中位数为表达水平临界值的Kaplan ‑Meier分析、 以四分位数为表达水 平临界值的Kaplan ‑Meier分析和Cox ‑PH分析鉴定卵巢癌生存相关基因, 再取三次分析具有 统计学意 义(P<0.05)的结果的交集, 筛 选出卵巢癌生存相关特 征基因; (4)绘制卵巢癌生存相关特征基因患者三年和五年生存情况的ROC曲线, 取结果具有统 计学意义 且AUC大于0.5的特征交集, 并利用平均AUC值对筛选所得特征降序排 序, 再通过 K均值聚类评价获得模型建立所需的13个 基因mRNA基因表达水平作为特 征;权 利 要 求 书 1/2 页 2 CN 115537467 A 2(5)以13个基因在卵巢癌样本中的表达水平为数据, 以深度神经网络为算法, 训练集和 测试集的分割比例为8:2, 通过5折交叉验证获取最优超参数, 超参数分别为: 网络第一层: Neurons number=200, A ctivation=Relu, Dropout=0.2; 网络第二层: Neurons  number= 100, Activation=Tanh, Dropout=0.2; 网络第三层: Neurons  number=3, Activation= Softmax, Dropout=0.2, 经测试集测试通过的模型为初始训练模型, 初始训练模型整合单 样本数据转换模块后为得到预测分子模型。 8.根据权利要求7所述基于深度神经网络的卵巢癌生存预后预测分子模型的建立方 法, 其特征在于: 所述单样本数据的转换公式: 9.检测13个基因标志物mRNA表达水平的试剂在制备卵巢癌生存预后预测分子模型的 试剂盒中的应用, 其特征在于: 所述13个基因标志物为分别为: SLC44A5、 AGR2、 TEX261、 HBP1、 NUMB、 ZNF 76、 ADIPOR2、 MARC HF9、 GTF2IRD1P1、 CO G5、 APMAP、 G OLT1B、 LYVE1。 10.根据权利要求9所述的应用, 其特 征在于: 所述试剂为qPCR检测试剂。权 利 要 求 书 2/2 页 3 CN 115537467 A 3

PDF文档 专利 基于深度神经网络的卵巢癌生存预后预测分子模型的建立方法及其应用

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于深度神经网络的卵巢癌生存预后预测分子模型的建立方法及其应用 第 1 页 专利 基于深度神经网络的卵巢癌生存预后预测分子模型的建立方法及其应用 第 2 页 专利 基于深度神经网络的卵巢癌生存预后预测分子模型的建立方法及其应用 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:33上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。