计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
29期
82-85,111
,共5页
基于实例的方法%部分可观察马尔可夫决策过程(POMDP)%启发式求解%增强学习%最近邻%局部加权回归
基于實例的方法%部分可觀察馬爾可伕決策過程(POMDP)%啟髮式求解%增彊學習%最近鄰%跼部加權迴歸
기우실례적방법%부분가관찰마이가부결책과정(POMDP)%계발식구해%증강학습%최근린%국부가권회귀
结合启发式求解和增强学习技术,深入研究了基于实例的POMDP问题的近似求解算法,包括基于最近邻算法法的NNI汲它的参数化增强版本ENNI和基于局部加权回归算法的LWI,并通过实验对比,给出了相应算法在实际应用中的性能.实验证明,基于实例的方法来求解POMDP问题,能够获得性能较好的次优解.
結閤啟髮式求解和增彊學習技術,深入研究瞭基于實例的POMDP問題的近似求解算法,包括基于最近鄰算法法的NNI伋它的參數化增彊版本ENNI和基于跼部加權迴歸算法的LWI,併通過實驗對比,給齣瞭相應算法在實際應用中的性能.實驗證明,基于實例的方法來求解POMDP問題,能夠穫得性能較好的次優解.
결합계발식구해화증강학습기술,심입연구료기우실례적POMDP문제적근사구해산법,포괄기우최근린산법법적NNI급타적삼수화증강판본ENNI화기우국부가권회귀산법적LWI,병통과실험대비,급출료상응산법재실제응용중적성능.실험증명,기우실례적방법래구해POMDP문제,능구획득성능교호적차우해.