CAJ | 학술논문

供应链协调问题多数基于主从博弈结构建模,但如果研究对象是相对复杂的供应链结构,理论求解主从博弈问题就变得困难.因此从求解一对一的供应链协调问题开始,针对主从博弈问题的特点,利用个体学习的进化博弈仿真手段,设计了经销商利用经验分布的预期随机需求的信念更新模式与最优反应的决策模式,为生产商分別设计了基于强化学习的信念更新模式与基于遗传算法搜索策略空间的决策模式,并将两者有机结合,取得了博弈问题的均衡解并且验证该解与理论求解结果一致,为进一步求解复杂问题提供了新的途径.
공응련협조문제다수기우주종박혁결구건모,단여과연구대상시상대복잡적공응련결구,이론구해주종박혁문제취변득곤난.인차종구해일대일적공응련협조문제개시,침대주종박혁문제적특점,이용개체학습적진화박혁방진수단,설계료경소상이용경험분포적예기수궤수구적신념경신모식여최우반응적결책모식,위생산상분별설계료기우강화학습적신념경신모식여기우유전산법수색책략공간적결책모식,병장량자유궤결합,취득료박혁문제적균형해병차험증해해여이론구해결과일치,위진일보구해복잡문제제공료신적도경.
Problems of coordinating supply chain are based on Stackelberg game model, but if research object is complex supply chain, it is difficult to find equilibrium of Stackelberg game, so evolutionary game theory was introduced. According to characteristics of leaders and followers in Stackelberg game model, learning mechanism is designed for each player respectively. An algorithm of reinforcement learning combined with genetic searching is proposed for leaders (manufacturers), and a learning model of best-reply is designed for followers (retailers).