(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211261064.8 (22)申请日 2022.10.14 (71)申请人 南京邮电大 学 地址 210046 江苏省南京市栖霞区文苑路9 号 (72)发明人 夏文超 周欢 徐林林 吕锦钰  倪艺洋 赵海涛  (74)专利代理 机构 南京经纬专利商标代理有限 公司 32200 专利代理师 朱小兵 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于连续学习的波束成形深度神经网络训 练方法及系统 (57)摘要 本发明公开了基于连续学习的波束成形深 度神经网络训练方法及系统, 该系统包括内存集 模块、 混合模块、 波束成形矩阵恢复模块、 神经网 络模块。 进入新时隙, 在每个时隙的训练过程中, 将内存集与当前时隙样本集混合供模型进行训 练, 在当前时隙的训练周 期结束后, 将内存集和 当前时隙样本集送入训练后的模型产生预测输 出。 针对所有样本的预测值, 模型计算性能函数 值, 依据每个样本性能, 按不同比例从内存集和 当前时隙样本集中挑选性能表现差的样本更新 内存集, 再次进入新的时隙时, 并迭代执行上述 步骤, 获得最优模型权重。 本发明基于连续学习 的波束成形深度神经网络训练方法适应动态变 化的实际通信环境, 在信道分布变化的情况下保 持良好的通信性能。 权利要求书3页 说明书5页 附图1页 CN 115470892 A 2022.12.13 CN 115470892 A 1.基于连续学习的波 束成形深度神经网络训练方法, 其特 征在于, 包括以下步骤: S1、 获得当前时隙t的信道数据, 以及该信道数据对应的上行功率向量标签值构建当前 时隙t的训练映射对Dt; S2、 基于已知的信道样本数据Mt, 将时隙t的训练映射对Dt和信道样本数据Mt前后堆叠 后随机打乱, 构成训练映射对集合Mt∪Dt, 以训练映射对集合Mt∪Dt中各个样本的信道数据 为输入、 训练映射对集合中各个信道数据对应的上行功 率向量标签值为输出构建并迭代训 练神经网络模型; 同时在迭代训练过程中利用最小均方误差函数作为损失函数进 行监督学 习, 直到遍历所有的训练映射对集合Mt∪Dt, 获得神经网络模型, 以及所述神经网络模型的 最优权重Θ; S3、 利用训练好的神经 网络模型, 将训练映射对集合Mt∪Dt中各个样本的信道信息输入 至该神经网络模型, 获得 预测的上 行功率分配向量; S4、 将预测的上行功率分配向量输入至波束成形矩恢复模块, 利用闭式解获得预测的 波束成形矩阵; S5、 基于预测的波束成形矩阵, 以及训练映射对集合Mt∪Dt, 利用性能函数计算所述预 测的波束成形矩阵和速率与训练映射对集合Mt∪Dt最优和速率的负比率, 根据该负比率按 照预设方法A分别针对Mt、 Dt选出符合预设条件的映射对, 将该映射对堆叠打乱获得信道样 本数据Mt+1, 并将信道样本数据Mt+1更新为信道样本数据Mt, 之后返回步骤S1。 2.根据权利要求1所述的基于连续学习的波束成形深度神经网络训练方法, 其特征在 于, 步骤S1中, 训练映射对Dt, 按如下方法获得: 将时隙t数据的信道矩阵Hk(k=1,2, …,K)取模值 (k=1,2, …,K)和WMMSE 加权最小均方误差算法生成的上行功率向量标签值Pk组成该时隙的训练映射对 其中, k是用户索引, Pk是样本标签值, 供模型的损失函数计算与预测值之间 的差距。 3.根据权利要求2所述的基于连续学习的波束成形深度神经网络训练方法, 其特征在 于, 步骤S2中, 在训练神经网络模型时, 设置最大迭代次数为M, 优化器为RMSpr op, 学习率为 l, 将训练映射对集合Mt∪Dt划分成若干个批次, 对 每个批次进行迭代, 迭代过程利用梯度下 降法更新模型权重, 优化全局损失函数, 对训练映射对集合Mt∪Dt遍历完毕, 该神经网络模 型训练过程结束, 模型收敛, 全局损失函数 取得最小值, 模型权 重Θ达到最优。 4.根据权利要求3所述的基于连续学习的波束成形深度神经网络训练方法, 其特征在 于, 步骤S3中获得 预测的上 行功率向量具体为: 将训练映射对集合Mt∪Dt中每个样本的信道信息 输入至训练好 的神经网络模型获 得到预测的上 行功率分配向量 π(Θ,h(i)), 其中i是样本索引。 5.根据权利要求4所述的基于连续学习的波束成形深度神经网络训练方法, 其特征在 于, 步骤S4中, 利用闭式解获得 预测的波 束成形矩阵包括如下子步骤: S4.1、 按如下公式计算神经网络模型 预测输出构建的第k个用户的波 束成形向量:权 利 要 求 书 1/3 页 2 CN 115470892 A 2其中, k是用户索引, i是样本索引, IN是单位阵, σ2是噪声功率, hk是基站到第k个用户的信道 向量, πk(Θ,h(i))是预测的第k个用户的上行功率向量, 是 的最大特征值对应的特 征向量的第k个元 素; S4.2、 将所有用户的波束成形向量按用户顺序组合, 得到预测的波束成形矩阵 6.根据权利要求5所述的基于连续学习的波束成形深度神经网络训练方法, 其特征在 于, 所述步骤S5中, 利用性能函数计算所述预测的波束成形矩阵和速率与训练映射对集合 Mt∪Dt最优和速率的负比率如下式: 其中, Θ是系统权重, h(i)是信道样本数据, p(i)是需要被神经网络模型学习的上行功率 向量, π(Θ,h(i))是神经网络模 型预测的上行功率分配向量, W( π(Θ,h(i)))是预测的波束成 形矩阵, R(W( π(Θ,h(i))); h(i))是预测的波束成形矩阵的和速 率, 是通过加权 最小均 方误差算法获得的训练映射对集 合Mt∪Dt最优和速率, 其中i是样本索引。 7.根据权利要求6所述的基于连续学习的波束成形深度神经网络训练方法, 其特征在 于, 步骤S5中, 根据负比率按照预设方法A分别针对Mt、 Dt选出符合预设条件的映射对, 将该 映射对堆叠打乱获得信道样本数据Mt+1, 并将信道样本数据Mt+1更新为信道样本数据Mt, 包 括如下步骤: S5.1、 对经过性能函数计算的样本数据中的Mt和Dt中的映射对进行降序 排序, 从Dt中挑 选前N‑f(t)个样本映射对, 从Mt中挑选前f(t)个样本映射对, 其中f(t)是关于时隙t的函 数; S5.2、 将Dt中挑选前N ‑f(t)个样本映射对和从Mt中挑选前f(t)个样本映射对堆叠打乱。 8.基于连续学习的波 束成形深度神经网络训练系统, 其特 征在于, 包括: 内存集模块, 用于存 储信道样本数据; 混合模块, 用于将当前时隙t的信道数据, 以及该信道数据对应的上行功率向量标签值权 利 要 求 书 2/3 页 3 CN 115470892 A 3

PDF文档 专利 基于连续学习的波束成形深度神经网络训练方法及系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于连续学习的波束成形深度神经网络训练方法及系统 第 1 页 专利 基于连续学习的波束成形深度神经网络训练方法及系统 第 2 页 专利 基于连续学习的波束成形深度神经网络训练方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:38上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。