计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2013年
7期
1991-1994
,共4页
近似动态规划%车辆调度%Q学习%探索策略
近似動態規劃%車輛調度%Q學習%探索策略
근사동태규화%차량조도%Q학습%탐색책략
approximate dynamic programming(ADP)%transportation scheduling%Q-Learning%explore strategy
采用近似动态规划(ADP)方法对钢铁物流运输过程中的车辆调度问题进行了分析,设计了车辆和运输货物的状态向量空间、动作向量空间等,充分考虑运输成本和能力约束,建立状态转移函数、目标函数,并对近似动态规划算法进行改进.在基于决策后状态的ADP算法的基础上,采用Boltzmann探索策略对所有的状态空间进行遍历,避免局部最优和低效问题.通过对比实验,比较Q学习算法、基于决策后状态的ADP算法以及采用Boltzmann探索策略的ADP算法的实验结果,证明了采用Boltzmann探索策略的ADP算法具有更快的收敛速度,执行效率更高.
採用近似動態規劃(ADP)方法對鋼鐵物流運輸過程中的車輛調度問題進行瞭分析,設計瞭車輛和運輸貨物的狀態嚮量空間、動作嚮量空間等,充分攷慮運輸成本和能力約束,建立狀態轉移函數、目標函數,併對近似動態規劃算法進行改進.在基于決策後狀態的ADP算法的基礎上,採用Boltzmann探索策略對所有的狀態空間進行遍歷,避免跼部最優和低效問題.通過對比實驗,比較Q學習算法、基于決策後狀態的ADP算法以及採用Boltzmann探索策略的ADP算法的實驗結果,證明瞭採用Boltzmann探索策略的ADP算法具有更快的收斂速度,執行效率更高.
채용근사동태규화(ADP)방법대강철물류운수과정중적차량조도문제진행료분석,설계료차량화운수화물적상태향량공간、동작향량공간등,충분고필운수성본화능력약속,건립상태전이함수、목표함수,병대근사동태규화산법진행개진.재기우결책후상태적ADP산법적기출상,채용Boltzmann탐색책략대소유적상태공간진행편력,피면국부최우화저효문제.통과대비실험,비교Q학습산법、기우결책후상태적ADP산법이급채용Boltzmann탐색책략적ADP산법적실험결과,증명료채용Boltzmann탐색책략적ADP산법구유경쾌적수렴속도,집행효솔경고.