软件
軟件
연건
SOFT WARE
2012年
12期
182-184
,共3页
自然语言处理%自动词发现%词激活力
自然語言處理%自動詞髮現%詞激活力
자연어언처리%자동사발현%사격활력
在使用计算机处理中文信息时,对词语的自动化发现技术有迫切的需求.因为在互联网时代,词语集合的更新换代非常之快,词语以非常快的节奏产生和消亡,这直接影响着对中文信息自动化处理的准确度和可靠性.为了解决这个难题,本文提出一种基于词激活力模型的中文词语发现方法.该方法将海量汉语语料建模成为有序的汉字序列,建立词激活力模型,分析字与字之间的联系程度,从而对任意两个汉字是否构成词语进行估计.在大规模语料集上的数据实验表明,该方法能够有效地对预料中的潜在词语进行自动化发现,达到了预期目标.
在使用計算機處理中文信息時,對詞語的自動化髮現技術有迫切的需求.因為在互聯網時代,詞語集閤的更新換代非常之快,詞語以非常快的節奏產生和消亡,這直接影響著對中文信息自動化處理的準確度和可靠性.為瞭解決這箇難題,本文提齣一種基于詞激活力模型的中文詞語髮現方法.該方法將海量漢語語料建模成為有序的漢字序列,建立詞激活力模型,分析字與字之間的聯繫程度,從而對任意兩箇漢字是否構成詞語進行估計.在大規模語料集上的數據實驗錶明,該方法能夠有效地對預料中的潛在詞語進行自動化髮現,達到瞭預期目標.
재사용계산궤처리중문신식시,대사어적자동화발현기술유박절적수구.인위재호련망시대,사어집합적경신환대비상지쾌,사어이비상쾌적절주산생화소망,저직접영향착대중문신식자동화처리적준학도화가고성.위료해결저개난제,본문제출일충기우사격활력모형적중문사어발현방법.해방법장해량한어어료건모성위유서적한자서렬,건립사격활력모형,분석자여자지간적련계정도,종이대임의량개한자시부구성사어진행고계.재대규모어료집상적수거실험표명,해방법능구유효지대예료중적잠재사어진행자동화발현,체도료예기목표.