电子学报
電子學報
전자학보
ACTA ELECTRONICA SINICA
2007年
2期
362-365
,共4页
高阳%胡景凯%王本年%王冬黎
高暘%鬍景凱%王本年%王鼕黎
고양%호경개%왕본년%왕동려
电梯群控调度%强化学习%CMAC神经网络%函数估计
電梯群控調度%彊化學習%CMAC神經網絡%函數估計
전제군공조도%강화학습%CMAC신경망락%함수고계
电梯群控调度是一类开放、动态、复杂系统的多目标优化问题.目前应用于群控电梯调度的算法主要有分区算法、基于搜索的算法、基于规则的算法和其他一些自适应的学习算法.但已有方法在顾客平均等待时间等目标上并不能够达到较好的优化性能.本文采用强化学习技术应用到电梯群控调度系统中,使用CMAC神经网络函数估计模块逼近强化学习的值函数,通过Q-学习算法来优化值函数,从而获得优化的电梯群控调度策略.通过仿真实验表明在下行高峰模式下,本文所提出的基于CMAC网络强化学习的群控电梯调度算法,能够有效地减少平均等待时间,提高电梯运行效率.
電梯群控調度是一類開放、動態、複雜繫統的多目標優化問題.目前應用于群控電梯調度的算法主要有分區算法、基于搜索的算法、基于規則的算法和其他一些自適應的學習算法.但已有方法在顧客平均等待時間等目標上併不能夠達到較好的優化性能.本文採用彊化學習技術應用到電梯群控調度繫統中,使用CMAC神經網絡函數估計模塊逼近彊化學習的值函數,通過Q-學習算法來優化值函數,從而穫得優化的電梯群控調度策略.通過倣真實驗錶明在下行高峰模式下,本文所提齣的基于CMAC網絡彊化學習的群控電梯調度算法,能夠有效地減少平均等待時間,提高電梯運行效率.
전제군공조도시일류개방、동태、복잡계통적다목표우화문제.목전응용우군공전제조도적산법주요유분구산법、기우수색적산법、기우규칙적산법화기타일사자괄응적학습산법.단이유방법재고객평균등대시간등목표상병불능구체도교호적우화성능.본문채용강화학습기술응용도전제군공조도계통중,사용CMAC신경망락함수고계모괴핍근강화학습적치함수,통과Q-학습산법래우화치함수,종이획득우화적전제군공조도책략.통과방진실험표명재하행고봉모식하,본문소제출적기우CMAC망락강화학습적군공전제조도산법,능구유효지감소평균등대시간,제고전제운행효솔.