苏州大学学报(自然科学版)
囌州大學學報(自然科學版)
소주대학학보(자연과학판)
JOURNAL OF SUZHOU UNIVERSITY NATURAL SCIENCE
2008年
3期
49-54
,共6页
沈勤中%周国栋%朱巧明%孔芳%丁金涛
瀋勤中%週國棟%硃巧明%孔芳%丁金濤
침근중%주국동%주교명%공방%정금도
中文分词%条件随机场%字位置概率特征
中文分詞%條件隨機場%字位置概率特徵
중문분사%조건수궤장%자위치개솔특정
将分词看成是一个对汉字进行分类的过程,然后利用条件随机场(CRFs)模型对每个汉字进行标记,最后转换为相应的分词结果.在现有CRFs模型的基础上,从字的构词能力角度出发,探索了字位置概率特征,提出了基于字位置概率特征的条件随机场中文分词方法.实验表明,字位置概率特征的引入,使得结果F1值提高了3.5%,达到94.5%.
將分詞看成是一箇對漢字進行分類的過程,然後利用條件隨機場(CRFs)模型對每箇漢字進行標記,最後轉換為相應的分詞結果.在現有CRFs模型的基礎上,從字的構詞能力角度齣髮,探索瞭字位置概率特徵,提齣瞭基于字位置概率特徵的條件隨機場中文分詞方法.實驗錶明,字位置概率特徵的引入,使得結果F1值提高瞭3.5%,達到94.5%.
장분사간성시일개대한자진행분류적과정,연후이용조건수궤장(CRFs)모형대매개한자진행표기,최후전환위상응적분사결과.재현유CRFs모형적기출상,종자적구사능력각도출발,탐색료자위치개솔특정,제출료기우자위치개솔특정적조건수궤장중문분사방법.실험표명,자위치개솔특정적인입,사득결과F1치제고료3.5%,체도94.5%.