计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2012年
23期
44-46,51
,共4页
孙天昊%邓俊昆%陈飞%朱庆生
孫天昊%鄧俊昆%陳飛%硃慶生
손천호%산준곤%진비%주경생
协商策略%增强学习%期望还原率
協商策略%增彊學習%期望還原率
협상책략%증강학습%기망환원솔
增强学习在电子商务中可以帮助Agent选择最优行动,并达成目标.在传统增强学习协商策略中,Agent一开始便进行大幅度的妥协,这是不合理的,与现实不符,降低了Agent的期望.通过期望还原率来还原Agent的真实期望,对协商策略进行优化;讨论了期望还原率的取值对协商过程的影响;通过实验验证了优化的协商策略在保证协商效率的同时,提高了协商解的质量.
增彊學習在電子商務中可以幫助Agent選擇最優行動,併達成目標.在傳統增彊學習協商策略中,Agent一開始便進行大幅度的妥協,這是不閤理的,與現實不符,降低瞭Agent的期望.通過期望還原率來還原Agent的真實期望,對協商策略進行優化;討論瞭期望還原率的取值對協商過程的影響;通過實驗驗證瞭優化的協商策略在保證協商效率的同時,提高瞭協商解的質量.
증강학습재전자상무중가이방조Agent선택최우행동,병체성목표.재전통증강학습협상책략중,Agent일개시편진행대폭도적타협,저시불합리적,여현실불부,강저료Agent적기망.통과기망환원솔래환원Agent적진실기망,대협상책략진행우화;토론료기망환원솔적취치대협상과정적영향;통과실험험증료우화적협상책략재보증협상효솔적동시,제고료협상해적질량.