情报学报
情報學報
정보학보
2010年
6期
1038-1044
,共7页
意见挖掘%产品属性识别%支持向量机%客户评论
意見挖掘%產品屬性識彆%支持嚮量機%客戶評論
의견알굴%산품속성식별%지지향량궤%객호평론
本文提出了一种结合自然语言处理技术与支持向量机模型,从客户评论中识别产品属性的方法.为了检验该方法的有效性,从收集的22 157条有关餐厅的评论语句中随机选取3701条,对其进行手工标注.针对手工标注语料库,利用支持向量机方法进行了产品属性识别训练和测试,并在准确率、召回率、F1值方面进行了评估.在测试结果中,平均准确率为95.6%,平均召回率为81.9%,平均F1值为87.3%.实验结果表明,该方法在平均准确率、平均召回率和平均F1值方面均高于最大熵模型方法,在句子层次上具有较好的属性识别效果.
本文提齣瞭一種結閤自然語言處理技術與支持嚮量機模型,從客戶評論中識彆產品屬性的方法.為瞭檢驗該方法的有效性,從收集的22 157條有關餐廳的評論語句中隨機選取3701條,對其進行手工標註.針對手工標註語料庫,利用支持嚮量機方法進行瞭產品屬性識彆訓練和測試,併在準確率、召迴率、F1值方麵進行瞭評估.在測試結果中,平均準確率為95.6%,平均召迴率為81.9%,平均F1值為87.3%.實驗結果錶明,該方法在平均準確率、平均召迴率和平均F1值方麵均高于最大熵模型方法,在句子層次上具有較好的屬性識彆效果.
본문제출료일충결합자연어언처리기술여지지향량궤모형,종객호평론중식별산품속성적방법.위료검험해방법적유효성,종수집적22 157조유관찬청적평론어구중수궤선취3701조,대기진행수공표주.침대수공표주어료고,이용지지향량궤방법진행료산품속성식별훈련화측시,병재준학솔、소회솔、F1치방면진행료평고.재측시결과중,평균준학솔위95.6%,평균소회솔위81.9%,평균F1치위87.3%.실험결과표명,해방법재평균준학솔、평균소회솔화평균F1치방면균고우최대적모형방법,재구자층차상구유교호적속성식별효과.