中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2008年
1期
111-115
,共5页
黄玉兰%龚才春%许洪波%程学旗
黃玉蘭%龔纔春%許洪波%程學旂
황옥란%공재춘%허홍파%정학기
计算机应用%中文信息处理%有意串%领域词典%大规模语料%伪相关反馈
計算機應用%中文信息處理%有意串%領域詞典%大規模語料%偽相關反饋
계산궤응용%중문신식처리%유의천%영역사전%대규모어료%위상관반궤
本文提出了一种基于伪相关反馈模型的领域词典自动生成算法.将领域词典生成过程视为领域术语的检索过程:假设初始检索出来的前若干个字符串与领域相关,将这些字符串加到领域词典中,重新检索,如此迭代,直到生成的领域词典达到预先设定的规模.实验表明,本算法经过若干次迭代后生成的领域词典准确率高于已有领域词典生成算法.
本文提齣瞭一種基于偽相關反饋模型的領域詞典自動生成算法.將領域詞典生成過程視為領域術語的檢索過程:假設初始檢索齣來的前若榦箇字符串與領域相關,將這些字符串加到領域詞典中,重新檢索,如此迭代,直到生成的領域詞典達到預先設定的規模.實驗錶明,本算法經過若榦次迭代後生成的領域詞典準確率高于已有領域詞典生成算法.
본문제출료일충기우위상관반궤모형적영역사전자동생성산법.장영역사전생성과정시위영역술어적검색과정:가설초시검색출래적전약간개자부천여영역상관,장저사자부천가도영역사전중,중신검색,여차질대,직도생성적영역사전체도예선설정적규모.실험표명,본산법경과약간차질대후생성적영역사전준학솔고우이유영역사전생성산법.