系统工程学报
繫統工程學報
계통공정학보
JOURNAL OF SYSTEMS ENGINEERING
2008年
3期
377-380
,共4页
钟麟%陈丽娟%佟明安%张圣云
鐘麟%陳麗娟%佟明安%張聖雲
종린%진려연%동명안%장골운
多智能体%影响图%学习%神经网络
多智能體%影響圖%學習%神經網絡
다지능체%영향도%학습%신경망락
提出一种多智能体学习算法.用影响图作为agent表示工具,给定agent的一个初始模型和它的历史行为,在能力、信念和优先学习的基础上来构建新的模型.学习方法是把其它agent的历史行为作为训练集,利用神经网络以及决策知识和专家知识来修改影响图中各结点的连接关系.针对与agent历史行为不一致的情况,本文把它看成效用函数发生了随机偏差,通过Markov chain-Monte Carlo技术进行模拟,实现效用函数的调整.最后利用多机编队协同空战作为例子说明算法的实用性.
提齣一種多智能體學習算法.用影響圖作為agent錶示工具,給定agent的一箇初始模型和它的歷史行為,在能力、信唸和優先學習的基礎上來構建新的模型.學習方法是把其它agent的歷史行為作為訓練集,利用神經網絡以及決策知識和專傢知識來脩改影響圖中各結點的連接關繫.針對與agent歷史行為不一緻的情況,本文把它看成效用函數髮生瞭隨機偏差,通過Markov chain-Monte Carlo技術進行模擬,實現效用函數的調整.最後利用多機編隊協同空戰作為例子說明算法的實用性.
제출일충다지능체학습산법.용영향도작위agent표시공구,급정agent적일개초시모형화타적역사행위,재능력、신념화우선학습적기출상래구건신적모형.학습방법시파기타agent적역사행위작위훈련집,이용신경망락이급결책지식화전가지식래수개영향도중각결점적련접관계.침대여agent역사행위불일치적정황,본문파타간성효용함수발생료수궤편차,통과Markov chain-Monte Carlo기술진행모의,실현효용함수적조정.최후이용다궤편대협동공전작위례자설명산법적실용성.