华东电力
華東電力
화동전력
EAST CHINA ELECTRIC POWER
2014年
5期
943-949
,共7页
钱虹%姚一鸣%陈丹%费敏锐
錢虹%姚一鳴%陳丹%費敏銳
전홍%요일명%진단%비민예
自动发电控制%强化Q学习算法%调节容量动态优化分配
自動髮電控製%彊化Q學習算法%調節容量動態優化分配
자동발전공제%강화Q학습산법%조절용량동태우화분배
AGC%reinforcement Q-learning algorithm%dynamic optimized allocation of regulation capacity
针对AGC调节容量多目标优化分配存在着无法完全描述机组特性的问题,通过研究提出采用基于强化Q学习的优化分配方法.将AGC系统视为“不确定的随机系统”,结合ACE的调节死区以及CPS评价标准,建立了AGC调节容量优化分配问题的马尔可夫决策过程模型,并引入Q学习方法对MDP的最优值函数进行学习,仿真结果表明,该强化Q学习-模糊多目标AGC调节容量动态优化分配策略能够适应电网环境变化的要求.
針對AGC調節容量多目標優化分配存在著無法完全描述機組特性的問題,通過研究提齣採用基于彊化Q學習的優化分配方法.將AGC繫統視為“不確定的隨機繫統”,結閤ACE的調節死區以及CPS評價標準,建立瞭AGC調節容量優化分配問題的馬爾可伕決策過程模型,併引入Q學習方法對MDP的最優值函數進行學習,倣真結果錶明,該彊化Q學習-模糊多目標AGC調節容量動態優化分配策略能夠適應電網環境變化的要求.
침대AGC조절용량다목표우화분배존재착무법완전묘술궤조특성적문제,통과연구제출채용기우강화Q학습적우화분배방법.장AGC계통시위“불학정적수궤계통”,결합ACE적조절사구이급CPS평개표준,건립료AGC조절용량우화분배문제적마이가부결책과정모형,병인입Q학습방법대MDP적최우치함수진행학습,방진결과표명,해강화Q학습-모호다목표AGC조절용량동태우화분배책략능구괄응전망배경변화적요구.