软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2014年
1期
51-63
,共13页
人工智能%自动规划%动作模型学习%不确定动作%部分观测
人工智能%自動規劃%動作模型學習%不確定動作%部分觀測
인공지능%자동규화%동작모형학습%불학정동작%부분관측
artificial intelligence%automated planning%learning action models%non-deterministic action%partial observability
近年来,动作模型学习引起了研究人员的极大兴趣.可是,尽管不确定规划已经研究了十几年,动作模型学习的研究仍然集中于经典的确定性动作模型上.提出了在部分观测环境下学习不确定动作模型的算法,该算法可应用于假定人们对转移系统一无所知的情形下进行,输入只有动作-观测序列.在现实世界中,这样的场景很常见.致力于动作是由简单逻辑结构组成的、且观测以一定频率出现的一类问题的研究.学习过程分为3个步骤:首先,计算命题在状态中成立的概率;然后,将命题抽取成效果模式,再抽取前提;最后,对效果模式进行聚类以去除冗余.在基准领域上进行的实验结果表明,动作模型学习技术可推广到不确定的部分观测环境中.
近年來,動作模型學習引起瞭研究人員的極大興趣.可是,儘管不確定規劃已經研究瞭十幾年,動作模型學習的研究仍然集中于經典的確定性動作模型上.提齣瞭在部分觀測環境下學習不確定動作模型的算法,該算法可應用于假定人們對轉移繫統一無所知的情形下進行,輸入隻有動作-觀測序列.在現實世界中,這樣的場景很常見.緻力于動作是由簡單邏輯結構組成的、且觀測以一定頻率齣現的一類問題的研究.學習過程分為3箇步驟:首先,計算命題在狀態中成立的概率;然後,將命題抽取成效果模式,再抽取前提;最後,對效果模式進行聚類以去除冗餘.在基準領域上進行的實驗結果錶明,動作模型學習技術可推廣到不確定的部分觀測環境中.
근년래,동작모형학습인기료연구인원적겁대흥취.가시,진관불학정규화이경연구료십궤년,동작모형학습적연구잉연집중우경전적학정성동작모형상.제출료재부분관측배경하학습불학정동작모형적산법,해산법가응용우가정인문대전이계통일무소지적정형하진행,수입지유동작-관측서렬.재현실세계중,저양적장경흔상견.치력우동작시유간단라집결구조성적、차관측이일정빈솔출현적일류문제적연구.학습과정분위3개보취:수선,계산명제재상태중성립적개솔;연후,장명제추취성효과모식,재추취전제;최후,대효과모식진행취류이거제용여.재기준영역상진행적실험결과표명,동작모형학습기술가추엄도불학정적부분관측배경중.