湖南理工学院学报(自然科学版)
湖南理工學院學報(自然科學版)
호남리공학원학보(자연과학판)
JOURNAL OF HUNAN INSTITUTE OF SCIENCE AND TECHNOLOGY(NATURAL SCIENCE)
2013年
4期
22-25
,共4页
交通控制%配时优化%排队长度%在线Q学习
交通控製%配時優化%排隊長度%在線Q學習
교통공제%배시우화%배대장도%재선Q학습
traffic control%timing optimization%queue length%on-line Q learning
建立了以平均排队长度差最小为优化目标的在线Q学习模型。针对控制性能指标相对于临近的配时方案不敏感的特点,提出了以平均排队长度差作为基本单位重新构造奖励函数,目的是拉大各行为对应的 Q 值差距,提高模型的收敛速度和鲁棒性。集成Excel VBA、Vissim、Matlab建立了在线仿真平台,作为计算环境对模型进行了计算。利用GPS数据对Vissim软件中车辆加减速度曲线进行了标定。计算结果表明以平均排队长度差作为优化目标能够优化整个交叉口的时空资源,本文建立的在线Q学习模型具有较快的收敛速度和鲁棒性,通过学习能够实现优化目标。
建立瞭以平均排隊長度差最小為優化目標的在線Q學習模型。針對控製性能指標相對于臨近的配時方案不敏感的特點,提齣瞭以平均排隊長度差作為基本單位重新構造獎勵函數,目的是拉大各行為對應的 Q 值差距,提高模型的收斂速度和魯棒性。集成Excel VBA、Vissim、Matlab建立瞭在線倣真平檯,作為計算環境對模型進行瞭計算。利用GPS數據對Vissim軟件中車輛加減速度麯線進行瞭標定。計算結果錶明以平均排隊長度差作為優化目標能夠優化整箇交扠口的時空資源,本文建立的在線Q學習模型具有較快的收斂速度和魯棒性,通過學習能夠實現優化目標。
건립료이평균배대장도차최소위우화목표적재선Q학습모형。침대공제성능지표상대우림근적배시방안불민감적특점,제출료이평균배대장도차작위기본단위중신구조장려함수,목적시랍대각행위대응적 Q 치차거,제고모형적수렴속도화로봉성。집성Excel VBA、Vissim、Matlab건립료재선방진평태,작위계산배경대모형진행료계산。이용GPS수거대Vissim연건중차량가감속도곡선진행료표정。계산결과표명이평균배대장도차작위우화목표능구우화정개교차구적시공자원,본문건립적재선Q학습모형구유교쾌적수렴속도화로봉성,통과학습능구실현우화목표。
For adapting the randomness of traffic flow, the paper builds an on-line Q learning model for minimizing average queue length difference. Because performance index is approximate at the adjacent signal timing, the paper puts forward a method of building reward function to increase the gap between different behaviours to improve the robustness and computation speed. The paper integrates VBA, Vissim, and Matlab to build a simulation platform. Signal timing optimization of a single intersection with two phases is done by the on-line Q learning model, which can optimize the time and space resources of the intersection.