计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
1期
290-292
,共3页
协商策略%增强学习%期望还原率%双边多议题
協商策略%增彊學習%期望還原率%雙邊多議題
협상책략%증강학습%기망환원솔%쌍변다의제
Negotiation strategy%Reinforcement learning%Expectation restoration rate%Bilateral multi-issue negotiation
针对传统增强学习算法存在妥协过快导致自身效用降低的缺点,通过设计改进增强学习算法的双边多议题协商模型,引入期望还原率,还原Agent的期望,从而提高协商解的质量.通过实验分析了期望还原率不同取值对协商的影响,并对传统增强学习协商策略、基于时间的协商策略和改进增强学习协商策略的协商效果做了对比.实验表明,在协商次数允许的范围之内,基于期望还原率的改进增强学习算法在双边多议题协商中能够提升双方的效用.
針對傳統增彊學習算法存在妥協過快導緻自身效用降低的缺點,通過設計改進增彊學習算法的雙邊多議題協商模型,引入期望還原率,還原Agent的期望,從而提高協商解的質量.通過實驗分析瞭期望還原率不同取值對協商的影響,併對傳統增彊學習協商策略、基于時間的協商策略和改進增彊學習協商策略的協商效果做瞭對比.實驗錶明,在協商次數允許的範圍之內,基于期望還原率的改進增彊學習算法在雙邊多議題協商中能夠提升雙方的效用.
침대전통증강학습산법존재타협과쾌도치자신효용강저적결점,통과설계개진증강학습산법적쌍변다의제협상모형,인입기망환원솔,환원Agent적기망,종이제고협상해적질량.통과실험분석료기망환원솔불동취치대협상적영향,병대전통증강학습협상책략、기우시간적협상책략화개진증강학습협상책략적협상효과주료대비.실험표명,재협상차수윤허적범위지내,기우기망환원솔적개진증강학습산법재쌍변다의제협상중능구제승쌍방적효용.