才智
纔智
재지
CAIZHI
2013年
5期
189-190
,共2页
盾构%推进策略%强化学习%分层强化
盾構%推進策略%彊化學習%分層彊化
순구%추진책략%강화학습%분층강화
盾构在隧道掘进中其姿态调整及推进的控制是顺利掘进的重要保证。但是盾构所处地质环境尤其是局部地质环境的不确定性,使得其姿态调整及推进策略的制定成为一项重要挑战。本文在姿态调整及推进策略制定中引入分层强化学习方法来对盾构姿态调整及推进策略进行学习,进而实现最优策略。学习算法将MAXQ分层学习算法及SVM算法结合,较好的实现了盾构姿态调整及推进策略的学习。
盾構在隧道掘進中其姿態調整及推進的控製是順利掘進的重要保證。但是盾構所處地質環境尤其是跼部地質環境的不確定性,使得其姿態調整及推進策略的製定成為一項重要挑戰。本文在姿態調整及推進策略製定中引入分層彊化學習方法來對盾構姿態調整及推進策略進行學習,進而實現最優策略。學習算法將MAXQ分層學習算法及SVM算法結閤,較好的實現瞭盾構姿態調整及推進策略的學習。
순구재수도굴진중기자태조정급추진적공제시순리굴진적중요보증。단시순구소처지질배경우기시국부지질배경적불학정성,사득기자태조정급추진책략적제정성위일항중요도전。본문재자태조정급추진책략제정중인입분층강화학습방법래대순구자태조정급추진책략진행학습,진이실현최우책략。학습산법장MAXQ분층학습산법급SVM산법결합,교호적실현료순구자태조정급추진책략적학습。