CAJ | 학술논문

万方数据

合肥工业大学学报（自然科学版） 합비공업대학학보（자연과학판）
JOURNAL OF HEFEI UNIVERSITY OF TECHNOLOGY(NATURAL SCIENCE)
2011年 1期 76-79 ,共4页

任付彪%周雷%马学森%魏振春任付彪%週雷%馬學森%魏振春

임부표%주뢰%마학삼%위진춘

连续时间Markov决策过程%事件驱动Q学习%呼叫接入控制連續時間Markov決策過程%事件驅動Q學習%呼叫接入控製
련속시간Markov결책과정%사건구동Q학습%호규접입공제

文章研究了计时报酬方式下最优呼叫接入控制问题,建立了系统的连续时间Markov决策过程(CTMDP),根据系统特征引入后状态Q值更新方法,给出呼叫接入控制问题基于事件驱动Q学习优化算法,并给出一个数值仿真实例;仿真结果表明,该算法比Q学习具有收敛速度快、存储空间小的优势;根据实验结果分析了在最优策略下业务拒绝率与业务特征的关系.
문장연구료계시보수방식하최우호규접입공제문제,건립료계통적련속시간Markov결책과정(CTMDP),근거계통특정인입후상태Q치경신방법,급출호규접입공제문제기우사건구동Q학습우화산법,병급출일개수치방진실례;방진결과표명,해산법비Q학습구유수렴속도쾌、존저공간소적우세;근거실험결과분석료재최우책략하업무거절솔여업무특정적관계.