通信学报
通信學報
통신학보
JOURNAL OF CHINA INSTITUTE OF COMMUNICATIONS
2015年
2期
186-192
,共7页
连续空间%离散化%强化学习%自适应%tile coding
連續空間%離散化%彊化學習%自適應%tile coding
련속공간%리산화%강화학습%자괄응%tile coding
continuous space%discretization%reinforcement learning%adaptive%tile coding
针对自适应tile coding算法会产生多余划分的问题,提出一种支持合并的自适应tile coding算法——MATC.该算法能够消除传统自适应tile coding算法中产生的多余划分,进一步解决连续状态空间离散化的问题.将MATC算法应用于离散动作连续状态的Mountain Car问题上,实验结果表明,该算法在学习过程中能消除传统tile coding算法的误划分所产生的不良影响,更准确地自动调整划分的精度,并更快地收敛到最佳策略.
針對自適應tile coding算法會產生多餘劃分的問題,提齣一種支持閤併的自適應tile coding算法——MATC.該算法能夠消除傳統自適應tile coding算法中產生的多餘劃分,進一步解決連續狀態空間離散化的問題.將MATC算法應用于離散動作連續狀態的Mountain Car問題上,實驗結果錶明,該算法在學習過程中能消除傳統tile coding算法的誤劃分所產生的不良影響,更準確地自動調整劃分的精度,併更快地收斂到最佳策略.
침대자괄응tile coding산법회산생다여화분적문제,제출일충지지합병적자괄응tile coding산법——MATC.해산법능구소제전통자괄응tile coding산법중산생적다여화분,진일보해결련속상태공간리산화적문제.장MATC산법응용우리산동작련속상태적Mountain Car문제상,실험결과표명,해산법재학습과정중능소제전통tile coding산법적오화분소산생적불량영향,경준학지자동조정화분적정도,병경쾌지수렴도최가책략.