计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2013年
10期
167-171
,共5页
孟佳娜%段晓东%杨亮
孟佳娜%段曉東%楊亮
맹가나%단효동%양량
特征变换%倾向性分析%产品评论%源领域%目标领域%领域独立词%领域依赖词
特徵變換%傾嚮性分析%產品評論%源領域%目標領域%領域獨立詞%領域依賴詞
특정변환%경향성분석%산품평론%원영역%목표영역%영역독립사%영역의뢰사
feature transformation%opinion analysis%product review%source domain%target domain%domain independent word%domain dependent word
传统的情感倾向性分析方法主要针对同一领域的文本,对于不同领域的文本,传统方法效果较差。为解决该问题,提出一种基于特征变换的跨领域产品评论倾向性分析方法。通过领域独立词建立源领域和目标领域的领域依赖词之间的关联,将源领域的领域知识迁移到目标领域中,以解决数据分布不同造成的分类器效果下降的问题。使用产品评论文本作为语料进行实验,结果表明,在所有语料上基于支持向量机和逻辑回归方法的平均精度分别为76.61%和76.81%,均高于Baseline算法的平均结果。
傳統的情感傾嚮性分析方法主要針對同一領域的文本,對于不同領域的文本,傳統方法效果較差。為解決該問題,提齣一種基于特徵變換的跨領域產品評論傾嚮性分析方法。通過領域獨立詞建立源領域和目標領域的領域依賴詞之間的關聯,將源領域的領域知識遷移到目標領域中,以解決數據分佈不同造成的分類器效果下降的問題。使用產品評論文本作為語料進行實驗,結果錶明,在所有語料上基于支持嚮量機和邏輯迴歸方法的平均精度分彆為76.61%和76.81%,均高于Baseline算法的平均結果。
전통적정감경향성분석방법주요침대동일영역적문본,대우불동영역적문본,전통방법효과교차。위해결해문제,제출일충기우특정변환적과영역산품평론경향성분석방법。통과영역독립사건립원영역화목표영역적영역의뢰사지간적관련,장원영역적영역지식천이도목표영역중,이해결수거분포불동조성적분류기효과하강적문제。사용산품평논문본작위어료진행실험,결과표명,재소유어료상기우지지향량궤화라집회귀방법적평균정도분별위76.61%화76.81%,균고우Baseline산법적평균결과。
Traditional sentiment analysis methods aim at same domain documents, the performance becomes worse for different domain documents. To solve this problem, this paper presents an opinion analysis method of cross-domain product reviews based on feature transformation. This proposed method builds the relevance of domain dependent words between source domain and target domain via domain independent words so that it can transfer acknowledge from the source domain to the target domain. It solves the classifier performance decreasing problem due to different data distributions. The product reviews are used as a corpus in the experiment. The average accuracies are 76.61% and 76.81% by using the methods of Support Vector Machine(SVM) and logistic regression respectively in all corpora. The results are higher than Baseline algorithm.