李中捷,熊吉源,高 伟,韦金迎
(中南民族大学 电子信息工程学院,武汉 430074)
随着无线移动通信的快速发展,毫米波(millimeter wave, mmWave)因其较大的带宽引起了人们的极大关注[1]。为了解决毫米波路径损耗大的问题,一般采用大规模多输入多输出(multiple input multiple output,MIMO)天线系统提供更高的阵列增益。通过配备数百个甚至数千个天线[2-4],采用波束成形技术,在基站和用户之间实现定向波束通信,可以显著提高网络传输的可达速率[5-6]。但是对波束信息持续跟踪和阻碍判断需要很大的训练开销,尤其是在动态环境中,毫米波易受阻碍影响,且信道状态信息变化快,每个相干块的周期短,无法为频繁而准确的波束对齐分配足够的时间。现有研究中的波束跟踪分为两大类:①基于用户移动性模型。文献[7]假设用户移动性满足一阶高斯马尔可夫模型,并提出了一个扩展的卡尔曼滤波方法来跟踪最佳波束;
文献[8]基于用户物理方向和速度定义的线性运动模型提出波束跟踪方案;
文献[9]提出基于二阶扩展卡尔曼滤波理论的波束跟踪算法;
②基于码本的波束跟踪,从预定的码本中找出最佳波束成形向量。文献[10]通过穷举搜索尝试从预定义码本的所有光束对中选择具有最大接收信号功率的最佳光束对;
文献[11]为了减少时间复杂性,通过三级搜索逐步缩小光束范围;
文献[12]通过利用离开角的时间变化,提出了一种基于码本的波束跟踪策略。波束跟踪技术可以降低训练开销,但对于大多数实际场景来说,波束跟踪技术所要求的信道建模假设过于严格。
为了减少训练开销, 可以从历史信息中提取环境变化情况,这样的想法得益于机器学习(machine learning, ML)的快速发展。文献[13]提出一种利用历史信道状态信息预测未来信道状态信息的机器学习方案;
文献[14]提出一种基于长短期记忆网络的角度预测光束跟踪方案;
文献[15]提出基于机器学习预测波束索引方案。然而,上述研究都未考虑到基站和用户的链路是否阻塞,通信系统过于理想化。因此,本文研究移动场景下,mmWave多输入单输出通信系统中低训练开销的波束跟踪和阻碍判断联合预测方案。
本文提出一种基于时间序列的波束跟踪和阻碍判断联合方案,该方案不需要利用动态信道建模的信道相关性,而是通过深度学习感知环境变化,开发了波束状态时间序列数据集用于联合预测方案,基于门控循环单元(gated recur-rent unit, GRU)设计预测模型[16],采用过去的连续时间序列波束状态变化来预测用户未来波束状态,并提出分布式固定输入门控循环单元(gated recurrent unit fixed input,GRU-FIN)训练算法以提高模型预测能力。通过仿真实验,分析了迭代次数、天线数量、信噪比和神经网络参数设置对预测模型性能的影响。仿真结果表明,该方案优于文献[13-15]所提方案,并且具有较好的连续预测能力。
图1为移动场景下的毫米波MISO通信系统,其中,fu[t]是在t时刻为用户u下行链路服务的波束状态。该系统中,基站配备天线数量为N的大规模均匀线性阵列(uniform linear array,ULA),移动用户配备单天线。
图1 系统场景Fig.1 System scene
考虑传输过程中路径损耗和阴影效应造成的大尺度衰落以及由多径效应和多普勒效应造成的小尺度衰落,采用平坦-块衰落几何信道模型[1],则基站与移动用户信道定义为
(1)
(1)式中:L为路径数;
β为路径损耗和阴影组成的大尺度衰落系数;
A(N,θ,Δ)为导向矢量组成的阵列响应矩阵,定义为A(N,θ,Δ)=[a1(N,φ1),a2(N,φ2),…,aL(N,φ)],其中,θ为离开角(direction of departure,DoD),Δ为小角度范围扩展[17],a(N,φ)为阵列响应向量,任意为波长,φ为第条路径的DoD,本文假设所有路径的DoD在Δ上服从均匀分布,即为多径效应导致的小尺度衰落系数组成的瑞利衰落向量,服从高斯分布CN(0,IL),连续时隙之间的变化可以根据一阶高斯-马尔可夫过程[18]定义为其中,ρ为相关系数,e(t)~CN(0,IL)为高斯白噪声;
为第条路径上的多普勒频移导致的小尺度衰落系数,其中,定义为和c分别是用户速度和光速。
假设基站采用单射频链和N个移相器构成的纯模拟架构[19],预定义的波束向量码本为F={f0,…,fQ},其中,Q为波束成形向量的总数,波束成形向量f定义为
q∈1,2,…,Q
(2)
(2)式中,m,d,θ分别为子载波数量、天线间距和转向角度。毫米波下行链路通信波束状态是通过索引I≡{(i):i=0,1,…,Q}选取波束码本F中所对应的向量。i=0时,表示用户为被阻碍状态,此时用户接收不到信号(f0=0);
i=1,…,Q时,表示用户为未被阻碍状态。得到最佳波束向量f*,将该波束向量用于下行数据传输,则用户接收的信号表示为
y=hTf*s+n
(3)
(3)式中:h为用户与基站的毫米波信道矩阵;
s为传输信号;
n~N(0,σ2)是服从均值为零和方差σ2的加性复高斯噪声。
本文研究目的是通过从码本F中选择基站的最佳波束成形向量,使用户下行链路可达速率最大化,表示为
s.t.fn∈F
(4)
穷举法搜寻最佳波束向量需要大量时间开销,文献[13-15]中一般将波束追踪与阻碍预测问题分别讨论。本文方法则是先设计波束状态联合数据集,然后提出基于时间序列的深度学习模型联合预测,实现移动用户场景下的快速波束状态预测,最后提出GRU-FIN分布式训练方案提高模型预测能力。
2.1 联合数据集
为解决波束追踪和阻碍判断的联合预测问题,本文设计了动态联合数据集。图2为数据集侧视图详细场景:一条长为500 m、宽为15 m的主街道,街道的两侧是宽各为10 m的人行道。数据集包含一个高为5 m的基站,50辆长为4.5 m、宽为2 m、高为1.4 m的小车(即移动用户)和15辆长为14米、宽为3 m、高为3 m的公交车(即障碍物)。为了模拟实际情况,数据集假设用户和阻碍物都在10~30 m/s内随机初始化速度,然后物体各自行进,到达车道末端后重新初始化。当物体遇到同一车道其他运动较慢的物体时,该物体会由最小位置设定改变速度。接收器位于各个物体的顶部,基站位于街道右端中间,配备不同天线阵列。通过动态模拟每2 s记录一次每个移动用户此刻最佳波束索引和信道状态信息,若为阻碍状态,则最佳波束索引记录为0,连续记录8个时刻的时间序列。模拟中考虑基站天线数量分别为16、32、64和128时的通信场景,其中每个场景产生3万个数据样本供模型训练和测试。
图2 无线通信环境侧视图Fig.2 Side view of wireless communication environment
2.2 GRU模型设计
GRU是处理长期时间序列预测问题的深度学习框架,且是mmWave信道预测的有效方法[13]。本文网络结构设计如图3所示,包含3部分:①词向量转换模块:采用Embedding将最佳波束成形向量索引转换为高维矩阵形式,从而达到提高预测精度的效果;
②堆叠GRU模块:采用GRU网络叠加构造;
③分类层:对未来最佳波束状态进行预测,由于波束状态联合预测包含波束索引预测和阻碍状态预测,因此,分类数量为天线阵列数量加1。
图3 基于GRU的网络结构Fig.3 Network structure based on GRU
2.3 GRU-FIN训练方案
本文基于2.2节所述基本框架,将波束状态预测类比为时间序列问题,提出基于分布式的GRU-FIN训练方案,能够显著提高移动环境下用户未来的波束预测能力。
分布式GRU-FIN训练方案如下。
输入:时间序列实例Su[t],t,K;
初始化:随机初始化网络参数。
1 fork=1,…,K
2 for episodeu=1,…,U
3 输入训练集通过Embedding模块向量化后输入到模型
5 利用Adam优化器更新网络参数
6 end for
7 输入测试集,计算预测准确率和(4)式
8 end for
方案中的准确率定义为
(5)
(5)式中:M为数据数量;
lk为预测标签;
gk为真实标签;
d(·)表示指标函数,如果lk=gk,则d(·)=1,否则为0。
当模型训练完成后被使用时[20],GRU-FIN方案总时间复杂度为O(K),穷举搜索的时间复杂度为O(NK),因此,本文方案的时间复杂度远低于穷举搜索。
3.1 仿真参数设置
本文无线仿真环境如表1所示,深度学习网络参数如表2所示。3种基线方案情况如下。
表1 无线仿真参数Tab.1 Wireless simulation parameters
表2 深度学习网络参数Tab.2 Deep learning network parameters
基线1方案:通过设定文献[15]中给出的相应参数,在本文系统下进行仿真(未加入阻碍状态判断)。词向量嵌入维度为50,隐藏状态尺寸r为20,其他参数与GRU-FIN设置相同。
基线2方案:基于2.2节GRU网络模型,在本文数据集下仿真,参数与GRU-FIN设置相同。
基线3方案:通过穷举法计算出本文系统下的最优解。
3.2 仿真结果分析
天线数量为128时,不同t,K,k值对准确率的影响如图4所示。
图4 天线数量为128时,不同t,K值对准确率的影响Fig.4 Effect of different t, K values on accuracy at 128 antennas
图4反映了随着模型的训练输入不同观察区间范围t和预测不同未来时刻K时准确率的变化情况。图4a中,当K=1时,基线2通过加深网络神经元和词向量嵌入维度,可以显著提高预测准确率,由于当前任务只预测未来一个时刻通信波束状态,因此,GRU-FIN所训练方法和基线2方法效果是相同的。图4b—图4f中,基线1和基线2整体预测的方案更偏向于fu[t+K]时刻的通信波束状态,对fu[t+1],fu[t+2],…,fu[t+K-1]时刻的预测准确率将会偏低,而GRU-FIN训练方案大幅度提高了fu[t+1],fu[t+2],…,fu[t+K-1]时刻的预测准确率,虽然呈现下降趋势,但fu[t+K]时刻的预测准确率也高于相同超参模型的基线2方案,且所需迭代次数三者相近。上述结果表明,基于分布训练的GRU-FIN方案比基线1和基线2整体预测方案更适合长时间连续未来波束的预测。
不同天线阵列下,t,K值对准确率的影响如图5所示。系统在基站处分别设置16,32,64,128天线阵列的状态下服务于单天线的用户。反映了随着天线阵列的变化输入不同观察区间范围t和预测不同未来时刻K时准确率的变化情况。图5a、图5c和图5f中,随着天线数量增加导致分类数量提升,基线1方案的性能大幅度下降,但基线2方案和GRU-FIN的性能下降缓慢。图5b和图5d中,在天线阵列由16提升到128,K分别为2和3的情况下,预测通信波束状态fu[t+1]时,基线1的预测准确率分别下降19.96%和22.86%,基线2的预测准确率分别下降6.46%和14.78%,GRU-FIN方案的预测准确率分别下降2.92%和3.83%,结果表明,提升网络深度和宽度时能够提升预测准确率,但只倾向于fu[t+N]时刻。GRU-FIN方法在预测序列Pu[t]和天线阵列增大时,仍能保证系统整体准确率。
图5 不同天线阵列,t,K值对准确率的影响Fig.5 Effect of different antenna arrays, t, K values on the accuracy
表3 不同模型的对比Tab.3 Comparison of different models
不同天线阵列和信噪比(signal-noiseratio,SNR)对可达速率的影响如图6所示。图6a—图6c中,该系统在基站处分别设置16,32,64,128天线阵列和SNR=0,10,20dB的状态下服务于单天线的用户,绘制了不同t,K时,预测未来通信波束状态与用户通信的平均可达速率。数值表明,随着SNR的增加,3种方案下的用户传输速率会逐渐提升,同时与系统上限基线3差值增大。在观察范围小的情况下,分布式GRU-FIN训练方案针对fu[t+1],fu[t+2],…,fu[t+N-1]时刻并行优化,保证用户的连续通信质量,减小与基线3的差距,提升系统整体性能。
图6 不同天线阵列和SNR对可达速率的影响Fig.6 Effect of different antenna arrays and SNR on reachable rate
不同网络参数对准确率的影响如图7所示,天线阵列为128,t=5,K=3,k=1。图7a给出网络深度分别为1,3,5层时,GRU-FIN方案的准确率随着迭代次数的变化情况,可以看出,网络深度为1时,训练过程会产生波动,提高网络深度会使模型训练过程更加稳定,但最终结果基本一致。图7b给出学习率分别为0.01,0.001,0.000 1时,GRU-FIN方案的准确率随着迭代次数的变化情况,可以看出,不同的学习率对GRU-FIN方案性能有很大影响,学习率为0.000 1时,收敛过程将变得十分缓慢,学习率为0.01时,梯度可能会在最小值附近来回震荡,导致无法收敛。
图7 不同网络参数对准确率的影响Fig.7 Influence of different network parameters on accuracy
本文基于多用户高速移动下的毫米波MISO通信系统,研究波束跟踪和阻碍判断的联合预测问题。首先,将波束跟踪和阻碍判断表述为时间序列问题,开发波束状态联合预测数据集;
其次,根据GRU结构构建基线2模型,并提出一种分布式GRU-FIN训练方案;
最后,对所设计的方案进行了性能对比,证明了所提出的分布训练方案对连续序列预测的有效性和鲁棒性,且适当的神经网络参数设置将提高算法的性能和收敛性。进一步,在网络的实时学习方面还需要更为充分详实的研究,这也是接下来的工作重点。