电信科学
電信科學
전신과학
TELECOMMUNICATIONS SCIENCE
2015年
8期
99-106
,共8页
异构无线网络%接入控制%资源管理%强化学习%Q学习
異構無線網絡%接入控製%資源管理%彊化學習%Q學習
이구무선망락%접입공제%자원관리%강화학습%Q학습
heterogeneous wireless network%access control%resource management%reinforcement learning%Q-learning
为了充分利用各种无线网络的资源,需要实现异构网络的融合,而异构网络的融合又面临接入控制与资源分配的问题.为此,提出一种基于强化学习的异构无线网络资源管理算法,该算法引入D2D(device-to-device)通信模式,并可以根据终端不同的业务类型、终端移动性及网络负载条件等状态,选择合适的网络接入方式.同时,为降低存储需求,采用神经网络技术解决连续状态空间问题.仿真结果表明,该算法具有高效的在线学习能力,能够有效地提升网络的频谱效用,降低阻塞率,从而实现自主的无线资源管理.
為瞭充分利用各種無線網絡的資源,需要實現異構網絡的融閤,而異構網絡的融閤又麵臨接入控製與資源分配的問題.為此,提齣一種基于彊化學習的異構無線網絡資源管理算法,該算法引入D2D(device-to-device)通信模式,併可以根據終耑不同的業務類型、終耑移動性及網絡負載條件等狀態,選擇閤適的網絡接入方式.同時,為降低存儲需求,採用神經網絡技術解決連續狀態空間問題.倣真結果錶明,該算法具有高效的在線學習能力,能夠有效地提升網絡的頻譜效用,降低阻塞率,從而實現自主的無線資源管理.
위료충분이용각충무선망락적자원,수요실현이구망락적융합,이이구망락적융합우면림접입공제여자원분배적문제.위차,제출일충기우강화학습적이구무선망락자원관리산법,해산법인입D2D(device-to-device)통신모식,병가이근거종단불동적업무류형、종단이동성급망락부재조건등상태,선택합괄적망락접입방식.동시,위강저존저수구,채용신경망락기술해결련속상태공간문제.방진결과표명,해산법구유고효적재선학습능력,능구유효지제승망락적빈보효용,강저조새솔,종이실현자주적무선자원관리.