控制理论与应用
控製理論與應用
공제이론여응용
CONTROL THEORY & APPLICATIONS
2011年
1期
58-64
,共7页
余涛%王宇名%甄卫国%叶文加%刘前进
餘濤%王宇名%甄衛國%葉文加%劉前進
여도%왕우명%견위국%협문가%류전진
Q(λ)学习%自动发电控制%控制性能标准%随机最优%调节费用
Q(λ)學習%自動髮電控製%控製性能標準%隨機最優%調節費用
Q(λ)학습%자동발전공제%공제성능표준%수궤최우%조절비용
单步Q学习在火电占优、机组时延较大的A动发电控制(AGC)功率指令动态优化分配中的应用表现出收敛速度慢等不足而影响最优策略的获取.具有多步预见能力的多步回溯Q学习(Q(λ))显式利用资格迹进行高效回溯操作,能够有效解决火电机组大时滞环节带来的延时回报问题,算法平均收敛时间较Q学习缩短50%以上.算法奖励函数引入调节费用一项,形成多目标动态最优控制.两区域模型及南方电网模型仿真研究分析显示,Q(λ)算法在随机、大负荷扰动的复杂系统环境中有效提高系统控制性能标准(CPS)控制品质和适应性,并且在保证CPS合格率的前提下,使AGC调节费用下降超过5%.
單步Q學習在火電佔優、機組時延較大的A動髮電控製(AGC)功率指令動態優化分配中的應用錶現齣收斂速度慢等不足而影響最優策略的穫取.具有多步預見能力的多步迴溯Q學習(Q(λ))顯式利用資格跡進行高效迴溯操作,能夠有效解決火電機組大時滯環節帶來的延時迴報問題,算法平均收斂時間較Q學習縮短50%以上.算法獎勵函數引入調節費用一項,形成多目標動態最優控製.兩區域模型及南方電網模型倣真研究分析顯示,Q(λ)算法在隨機、大負荷擾動的複雜繫統環境中有效提高繫統控製性能標準(CPS)控製品質和適應性,併且在保證CPS閤格率的前提下,使AGC調節費用下降超過5%.
단보Q학습재화전점우、궤조시연교대적A동발전공제(AGC)공솔지령동태우화분배중적응용표현출수렴속도만등불족이영향최우책략적획취.구유다보예견능력적다보회소Q학습(Q(λ))현식이용자격적진행고효회소조작,능구유효해결화전궤조대시체배절대래적연시회보문제,산법평균수렴시간교Q학습축단50%이상.산법장려함수인입조절비용일항,형성다목표동태최우공제.량구역모형급남방전망모형방진연구분석현시,Q(λ)산법재수궤、대부하우동적복잡계통배경중유효제고계통공제성능표준(CPS)공제품질화괄응성,병차재보증CPS합격솔적전제하,사AGC조절비용하강초과5%.