合肥工业大学学报(自然科学版)
閤肥工業大學學報(自然科學版)
합비공업대학학보(자연과학판)
JOURNAL OF HEFEI UNIVERSITY OF TECHNOLOGY(NATURAL SCIENCE)
2011年
1期
76-79
,共4页
任付彪%周雷%马学森%魏振春
任付彪%週雷%馬學森%魏振春
임부표%주뢰%마학삼%위진춘
连续时间Markov决策过程%事件驱动Q学习%呼叫接入控制
連續時間Markov決策過程%事件驅動Q學習%呼叫接入控製
련속시간Markov결책과정%사건구동Q학습%호규접입공제
文章研究了计时报酬方式下最优呼叫接入控制问题,建立了系统的连续时间Markov决策过程(CTMDP),根据系统特征引入后状态Q值更新方法,给出呼叫接入控制问题基于事件驱动Q学习优化算法,并给出一个数值仿真实例;仿真结果表明,该算法比Q学习具有收敛速度快、存储空间小的优势;根据实验结果分析了在最优策略下业务拒绝率与业务特征的关系.
文章研究瞭計時報酬方式下最優呼叫接入控製問題,建立瞭繫統的連續時間Markov決策過程(CTMDP),根據繫統特徵引入後狀態Q值更新方法,給齣呼叫接入控製問題基于事件驅動Q學習優化算法,併給齣一箇數值倣真實例;倣真結果錶明,該算法比Q學習具有收斂速度快、存儲空間小的優勢;根據實驗結果分析瞭在最優策略下業務拒絕率與業務特徵的關繫.
문장연구료계시보수방식하최우호규접입공제문제,건립료계통적련속시간Markov결책과정(CTMDP),근거계통특정인입후상태Q치경신방법,급출호규접입공제문제기우사건구동Q학습우화산법,병급출일개수치방진실례;방진결과표명,해산법비Q학습구유수렴속도쾌、존저공간소적우세;근거실험결과분석료재최우책략하업무거절솔여업무특정적관계.