教育观察(下半月)
教育觀察(下半月)
교육관찰(하반월)
Survey of Education
2015年
10期
20-22
,共3页
强化学习%基于模型系统%模型无关系统%学习%决策
彊化學習%基于模型繫統%模型無關繫統%學習%決策
강화학습%기우모형계통%모형무관계통%학습%결책
在复杂环境中求得生存,适应性主体必须具备预测未来可能发生事件的能力。受未来预期变化的驱使,这种预测能力的培养需要不断地进行学习探索,以提高在遭遇冲突时做出有效决策的准确率。学习与决策双过程理论将学习过程分为基于行为和基于结果的学习。研究发现,强化学习算法与双过程理论存在紧密联结,为理解在人类大脑中进行学习与决策的过程提供理论依据。同时,可以将强化学习理论引向教育领域,RPE、TDRL 等学习算法在提高学生的学习效率、改善学习策略等方面具有推动作用。
在複雜環境中求得生存,適應性主體必鬚具備預測未來可能髮生事件的能力。受未來預期變化的驅使,這種預測能力的培養需要不斷地進行學習探索,以提高在遭遇遲突時做齣有效決策的準確率。學習與決策雙過程理論將學習過程分為基于行為和基于結果的學習。研究髮現,彊化學習算法與雙過程理論存在緊密聯結,為理解在人類大腦中進行學習與決策的過程提供理論依據。同時,可以將彊化學習理論引嚮教育領域,RPE、TDRL 等學習算法在提高學生的學習效率、改善學習策略等方麵具有推動作用。
재복잡배경중구득생존,괄응성주체필수구비예측미래가능발생사건적능력。수미래예기변화적구사,저충예측능력적배양수요불단지진행학습탐색,이제고재조우충돌시주출유효결책적준학솔。학습여결책쌍과정이론장학습과정분위기우행위화기우결과적학습。연구발현,강화학습산법여쌍과정이론존재긴밀련결,위리해재인류대뇌중진행학습여결책적과정제공이론의거。동시,가이장강화학습이론인향교육영역,RPE、TDRL 등학습산법재제고학생적학습효솔、개선학습책략등방면구유추동작용。