公路交通科技
公路交通科技
공로교통과기
JOURNAL OF HIGHWAY AND TRANSPORTATION RESEARCH AND DEVELOPMENT
2014年
11期
116-122
,共7页
交通工程%在线Q学习%配时优化%排队长度
交通工程%在線Q學習%配時優化%排隊長度
교통공정%재선Q학습%배시우화%배대장도
traffic engineering%on-line Q learning%timing optimization%queue length
为改善交叉口排队长度管理,避免交叉口某个方向排队长度过长,采用强化学习理论建立了以平均排队长度差最小为优化目标的在线Q学习模型.针对控制性能指标相对于邻近的配时方案不敏感的特点,提出了以平均排队长度差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性.集成Excel VBA,Vissim,Matlab建立了在线仿真平台,作为计算环境对算例进行了计算.算例中利用GPS数据对Vissim软件中车辆加减速度曲线进行了标定.计算结果表明以平均排队长度差作为优化目标能够提高各个方向排队长度的平衡性,优化整个交叉口的时空资源;建立的在线Q模型具有学习能力和较快的计算速度,模型能否收敛受到周期取值和可选行为数量的影响.
為改善交扠口排隊長度管理,避免交扠口某箇方嚮排隊長度過長,採用彊化學習理論建立瞭以平均排隊長度差最小為優化目標的在線Q學習模型.針對控製性能指標相對于鄰近的配時方案不敏感的特點,提齣瞭以平均排隊長度差作為基本單位重新構造獎勵函數,目的是拉大各行為對應的Q值差距,提高模型的收斂速度和魯棒性.集成Excel VBA,Vissim,Matlab建立瞭在線倣真平檯,作為計算環境對算例進行瞭計算.算例中利用GPS數據對Vissim軟件中車輛加減速度麯線進行瞭標定.計算結果錶明以平均排隊長度差作為優化目標能夠提高各箇方嚮排隊長度的平衡性,優化整箇交扠口的時空資源;建立的在線Q模型具有學習能力和較快的計算速度,模型能否收斂受到週期取值和可選行為數量的影響.
위개선교차구배대장도관리,피면교차구모개방향배대장도과장,채용강화학습이론건립료이평균배대장도차최소위우화목표적재선Q학습모형.침대공제성능지표상대우린근적배시방안불민감적특점,제출료이평균배대장도차작위기본단위중신구조장려함수,목적시랍대각행위대응적Q치차거,제고모형적수렴속도화로봉성.집성Excel VBA,Vissim,Matlab건립료재선방진평태,작위계산배경대산례진행료계산.산례중이용GPS수거대Vissim연건중차량가감속도곡선진행료표정.계산결과표명이평균배대장도차작위우화목표능구제고각개방향배대장도적평형성,우화정개교차구적시공자원;건립적재선Q모형구유학습능력화교쾌적계산속도,모형능부수렴수도주기취치화가선행위수량적영향.