电视技术
電視技術
전시기술
TV ENGINEERING
2014年
15期
193-197,226
,共6页
张娟%蒋和松%江虹%陈春梅
張娟%蔣和鬆%江虹%陳春梅
장연%장화송%강홍%진춘매
频谱共享%多臂赌博机%在线学习%部分可观察的马尔科夫
頻譜共享%多臂賭博機%在線學習%部分可觀察的馬爾科伕
빈보공향%다비도박궤%재선학습%부분가관찰적마이과부
spectrum%sharing%multi-armed%bandit%online%learning%partially%observable%markov%decision%process
在认知无线电中,对频谱共享的典型研究具有以下两方面的缺点:第一,目前的研究大都基于信道状态完全已知的马尔科夫建模,使得这类模型的应用受到很大的限制;第二,大部分研究都是基于信道感知的在线学习,没有考虑不同信道状态下的最优传输的在线学习.针对以上问题,提出了一种新的算法:将信道未知情况下的最优传输策略建模为多臂赌博机模型.仿真分析表明:在信道不完全可知情况下的多臂赌博机在线学习算法和单门限最优离线传输策略相比,同样能获得最优K步策略.同时,本文通过UCB-TUNED方法改善了最优传输的K步保守策略的收敛性.
在認知無線電中,對頻譜共享的典型研究具有以下兩方麵的缺點:第一,目前的研究大都基于信道狀態完全已知的馬爾科伕建模,使得這類模型的應用受到很大的限製;第二,大部分研究都是基于信道感知的在線學習,沒有攷慮不同信道狀態下的最優傳輸的在線學習.針對以上問題,提齣瞭一種新的算法:將信道未知情況下的最優傳輸策略建模為多臂賭博機模型.倣真分析錶明:在信道不完全可知情況下的多臂賭博機在線學習算法和單門限最優離線傳輸策略相比,同樣能穫得最優K步策略.同時,本文通過UCB-TUNED方法改善瞭最優傳輸的K步保守策略的收斂性.
재인지무선전중,대빈보공향적전형연구구유이하량방면적결점:제일,목전적연구대도기우신도상태완전이지적마이과부건모,사득저류모형적응용수도흔대적한제;제이,대부분연구도시기우신도감지적재선학습,몰유고필불동신도상태하적최우전수적재선학습.침대이상문제,제출료일충신적산법:장신도미지정황하적최우전수책략건모위다비도박궤모형.방진분석표명:재신도불완전가지정황하적다비도박궤재선학습산법화단문한최우리선전수책략상비,동양능획득최우K보책략.동시,본문통과UCB-TUNED방법개선료최우전수적K보보수책략적수렴성.