深圳职业技术学院学报
深圳職業技術學院學報
심수직업기술학원학보
JOURNAL OF SHENZHEN POLYTECNIC
2013年
1期
3-10
,共8页
部分可观察马尔可夫决策过程%序贯决策%信念状态空间%在线算法%维数灾
部分可觀察馬爾可伕決策過程%序貫決策%信唸狀態空間%在線算法%維數災
부분가관찰마이가부결책과정%서관결책%신념상태공간%재선산법%유수재
部分可观察马尔可夫决策过程(Partially Observable Markov Decision Processes,POMDPs)是动态不确定环境下序贯决策的理想模型,但是现有算法都陷入“维数灾”和“历史灾”问题,造成理想的POMDPs模型无法在实际工程中得到应用.本文首先详细分析了POMDPs精确算法的复杂度,阐述问题求解的难点;然后比较分析现有基于点的离线算法和在线算法两类算法的算法思想和时间复杂度,指出两类算法的优缺点;最后简介POMDPs实际应用情况和未来的研究方向.
部分可觀察馬爾可伕決策過程(Partially Observable Markov Decision Processes,POMDPs)是動態不確定環境下序貫決策的理想模型,但是現有算法都陷入“維數災”和“歷史災”問題,造成理想的POMDPs模型無法在實際工程中得到應用.本文首先詳細分析瞭POMDPs精確算法的複雜度,闡述問題求解的難點;然後比較分析現有基于點的離線算法和在線算法兩類算法的算法思想和時間複雜度,指齣兩類算法的優缺點;最後簡介POMDPs實際應用情況和未來的研究方嚮.
부분가관찰마이가부결책과정(Partially Observable Markov Decision Processes,POMDPs)시동태불학정배경하서관결책적이상모형,단시현유산법도함입“유수재”화“역사재”문제,조성이상적POMDPs모형무법재실제공정중득도응용.본문수선상세분석료POMDPs정학산법적복잡도,천술문제구해적난점;연후비교분석현유기우점적리선산법화재선산법량류산법적산법사상화시간복잡도,지출량류산법적우결점;최후간개POMDPs실제응용정황화미래적연구방향.