计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2007年
21期
157-159
,共3页
贺敏%龚才春%张华平%程学旗
賀敏%龔纔春%張華平%程學旂
하민%공재춘%장화평%정학기
新词%邻接类别%单字成词概率%双字耦合度
新詞%鄰接類彆%單字成詞概率%雙字耦閤度
신사%린접유별%단자성사개솔%쌍자우합도
提出了一种基于大规模语料的新词识别方法,在重复串统计的基础上,结合分析不同串的外部环境和内部构成,依次判断上下文邻接种类,首尾单字位置成词概率以及双字耦合度等语言特征,分别过滤得到新词.通过在不同规模的语料上实验发现,此方法可行有效,能够应用到词典编撰,术语提取等领域.
提齣瞭一種基于大規模語料的新詞識彆方法,在重複串統計的基礎上,結閤分析不同串的外部環境和內部構成,依次判斷上下文鄰接種類,首尾單字位置成詞概率以及雙字耦閤度等語言特徵,分彆過濾得到新詞.通過在不同規模的語料上實驗髮現,此方法可行有效,能夠應用到詞典編撰,術語提取等領域.
제출료일충기우대규모어료적신사식별방법,재중복천통계적기출상,결합분석불동천적외부배경화내부구성,의차판단상하문린접충류,수미단자위치성사개솔이급쌍자우합도등어언특정,분별과려득도신사.통과재불동규모적어료상실험발현,차방법가행유효,능구응용도사전편찬,술어제취등영역.