计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2010年
8期
276-278
,共3页
王舵%郄君%张娟%李文斌
王舵%郄君%張娟%李文斌
왕타%극군%장연%리문빈
词聚类%似然函数%覆盖方法
詞聚類%似然函數%覆蓋方法
사취류%사연함수%복개방법
词聚类是语言自动处理中一个重要的基础环节.传统的统计方法基于贪婪原则,常以语料的似然函数或困惑度作为评价标准,其主要缺点是:聚类速度慢、初值对结果的影响大、易陷入局部最优.针对这些问题,提出了基于相似度测度和覆盖方法的聚类方法.该方法计算量小、聚类速度快.而且,借助覆盖原理有效减小了初始点选取对聚类的影响程度.实验证明,效果理想.
詞聚類是語言自動處理中一箇重要的基礎環節.傳統的統計方法基于貪婪原則,常以語料的似然函數或睏惑度作為評價標準,其主要缺點是:聚類速度慢、初值對結果的影響大、易陷入跼部最優.針對這些問題,提齣瞭基于相似度測度和覆蓋方法的聚類方法.該方法計算量小、聚類速度快.而且,藉助覆蓋原理有效減小瞭初始點選取對聚類的影響程度.實驗證明,效果理想.
사취류시어언자동처리중일개중요적기출배절.전통적통계방법기우탐람원칙,상이어료적사연함수혹곤혹도작위평개표준,기주요결점시:취류속도만、초치대결과적영향대、역함입국부최우.침대저사문제,제출료기우상사도측도화복개방법적취류방법.해방법계산량소、취류속도쾌.이차,차조복개원리유효감소료초시점선취대취류적영향정도.실험증명,효과이상.