工业控制计算机
工業控製計算機
공업공제계산궤
Industrial Control Computer
2015年
11期
105-106,108
,共3页
CRF模型%支持向量机%最大正向模糊匹配%投票混合模型
CRF模型%支持嚮量機%最大正嚮模糊匹配%投票混閤模型
CRF모형%지지향량궤%최대정향모호필배%투표혼합모형
CRF model%support vector machine%the biggest positive fuzzy matching%vote hybrid model
针对现有的中文分词算法在特殊领域的分词性能并不理想的问题,在基于CRF分词器的基础上,结合传统的基于字典的分词方法,以及支持向量机(Support Vector Machine,SVM)分词工具,实现了一种基于投票混合模型的地址分词方法,并使用非标准地址数据对该模型进行训练与测试。实验结果表明,在对中文地址数据的分词中,该分词器比几种常用的分词工具具有更好的分词性能,为基于分词的地址数据清洗做了一个重要的基础。
針對現有的中文分詞算法在特殊領域的分詞性能併不理想的問題,在基于CRF分詞器的基礎上,結閤傳統的基于字典的分詞方法,以及支持嚮量機(Support Vector Machine,SVM)分詞工具,實現瞭一種基于投票混閤模型的地阯分詞方法,併使用非標準地阯數據對該模型進行訓練與測試。實驗結果錶明,在對中文地阯數據的分詞中,該分詞器比幾種常用的分詞工具具有更好的分詞性能,為基于分詞的地阯數據清洗做瞭一箇重要的基礎。
침대현유적중문분사산법재특수영역적분사성능병불이상적문제,재기우CRF분사기적기출상,결합전통적기우자전적분사방법,이급지지향량궤(Support Vector Machine,SVM)분사공구,실현료일충기우투표혼합모형적지지분사방법,병사용비표준지지수거대해모형진행훈련여측시。실험결과표명,재대중문지지수거적분사중,해분사기비궤충상용적분사공구구유경호적분사성능,위기우분사적지지수거청세주료일개중요적기출。
Due to the fact that the performance of the existing Chinese word segmentation algorithm in specific areas is not good as expected,Chinese address word segmentation based on vote hybrid model on the basis of CRF-based word segmentation,traditional dictionary-based segmentation method and support vector machine (Support Vector Machine,SVM) segmentation tools is implemented in this paper,which is trained and tested on a non-standard address data.