CAJ | 학술논문

针对AGC调节容量多目标优化分配存在着无法完全描述机组特性的问题,通过研究提出采用基于强化Q学习的优化分配方法.将AGC系统视为“不确定的随机系统”,结合ACE的调节死区以及CPS评价标准,建立了AGC调节容量优化分配问题的马尔可夫决策过程模型,并引入Q学习方法对MDP的最优值函数进行学习,仿真结果表明,该强化Q学习-模糊多目标AGC调节容量动态优化分配策略能够适应电网环境变化的要求.
침대AGC조절용량다목표우화분배존재착무법완전묘술궤조특성적문제,통과연구제출채용기우강화Q학습적우화분배방법.장AGC계통시위“불학정적수궤계통”,결합ACE적조절사구이급CPS평개표준,건립료AGC조절용량우화분배문제적마이가부결책과정모형,병인입Q학습방법대MDP적최우치함수진행학습,방진결과표명,해강화Q학습-모호다목표AGC조절용량동태우화분배책략능구괄응전망배경변화적요구.