计算机工程与应用
計算機工程與應用
계산궤공정여응용
Computer Engineering and Applications
2015年
22期
28-32
,共5页
依存句法解析%文本情感分类%向量空间模型%深度信念网络
依存句法解析%文本情感分類%嚮量空間模型%深度信唸網絡
의존구법해석%문본정감분류%향량공간모형%심도신념망락
dependency syntactic relation%sentiment classification%vector space model%deep belief network
为增加向量空间模型的文本语义信息,提出三元组依存关系特征构建方法,将此方法用于文本情感分类任务中。三元组依存关系特征构建方法在得到完整依存解析树的基础上,先依据中文语法特点,制定相应规则对原有完整树进行冗余结点的合并和删除;再将保留的依存树转化为三元组关系并一般化后作为向量空间模型特征项。为了验证此种特征表示方法的有效性,构造出在一元词基础上添加句法特征、简单依存关系特征和词典得分不同组合下的特征向量空间。将三元组依存关系特征向量与构造出的不同组合特征向量分别用于支持向量机和深度信念网络中。结果表明,三元组依存关系文本表示方法在分类精度上均高于其他特征组合表示方法,进一步说明三元组依存关系特征能更充分表达文本语义信息。
為增加嚮量空間模型的文本語義信息,提齣三元組依存關繫特徵構建方法,將此方法用于文本情感分類任務中。三元組依存關繫特徵構建方法在得到完整依存解析樹的基礎上,先依據中文語法特點,製定相應規則對原有完整樹進行冗餘結點的閤併和刪除;再將保留的依存樹轉化為三元組關繫併一般化後作為嚮量空間模型特徵項。為瞭驗證此種特徵錶示方法的有效性,構造齣在一元詞基礎上添加句法特徵、簡單依存關繫特徵和詞典得分不同組閤下的特徵嚮量空間。將三元組依存關繫特徵嚮量與構造齣的不同組閤特徵嚮量分彆用于支持嚮量機和深度信唸網絡中。結果錶明,三元組依存關繫文本錶示方法在分類精度上均高于其他特徵組閤錶示方法,進一步說明三元組依存關繫特徵能更充分錶達文本語義信息。
위증가향량공간모형적문본어의신식,제출삼원조의존관계특정구건방법,장차방법용우문본정감분류임무중。삼원조의존관계특정구건방법재득도완정의존해석수적기출상,선의거중문어법특점,제정상응규칙대원유완정수진행용여결점적합병화산제;재장보류적의존수전화위삼원조관계병일반화후작위향량공간모형특정항。위료험증차충특정표시방법적유효성,구조출재일원사기출상첨가구법특정、간단의존관계특정화사전득분불동조합하적특정향량공간。장삼원조의존관계특정향량여구조출적불동조합특정향량분별용우지지향량궤화심도신념망락중。결과표명,삼원조의존관계문본표시방법재분류정도상균고우기타특정조합표시방법,진일보설명삼원조의존관계특정능경충분표체문본어의신식。
In order to improve the semantic understanding of terms in vector space model, this paper proposes a new text representation method based on dependency parser. Based on the dependency parser tree transformed from the text, some useless nodes are merged and deleted according to Chinese grammar rules firstly. Then the retained tree will be transformed into triple dependency relation features. The generalized triple dependency relation features will be used as the feature set of vector space model. For verifying the new method’s efficiency, different feature sets based on bag-of-words are extracted to be the baseline. All of the feature vectors are applied into SVM and DBN to get the classification accuracy. The results indicate that triple dependency relation features is rich of semantic information.