计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2013年
6期
196-198
,共3页
中文信息处理%微博%命名实体%条件随机场
中文信息處理%微博%命名實體%條件隨機場
중문신식처리%미박%명명실체%조건수궤장
微博这一媒体形式的迅速发展为命名实体识别提供了一个新的载体.根据微博文本的特点,提出针对中文微博的命名实体识别方法.首先,对微博文本做规范化处理,消除由于微博表达不规范造成的干扰;在建立中文人名库、常用地点库等知识库的基础上,选取适合微博的特征模板,使用条件随机场方法进行实体识别;同时,将正确的识别结果添加到知识库中以提升识别效果.在真实微博数据上的实验表明,该方法能够有效地完成中文微博的命名实体识别任务.
微博這一媒體形式的迅速髮展為命名實體識彆提供瞭一箇新的載體.根據微博文本的特點,提齣針對中文微博的命名實體識彆方法.首先,對微博文本做規範化處理,消除由于微博錶達不規範造成的榦擾;在建立中文人名庫、常用地點庫等知識庫的基礎上,選取適閤微博的特徵模闆,使用條件隨機場方法進行實體識彆;同時,將正確的識彆結果添加到知識庫中以提升識彆效果.在真實微博數據上的實驗錶明,該方法能夠有效地完成中文微博的命名實體識彆任務.
미박저일매체형식적신속발전위명명실체식별제공료일개신적재체.근거미박문본적특점,제출침대중문미박적명명실체식별방법.수선,대미박문본주규범화처리,소제유우미박표체불규범조성적간우;재건립중문인명고、상용지점고등지식고적기출상,선취괄합미박적특정모판,사용조건수궤장방법진행실체식별;동시,장정학적식별결과첨가도지식고중이제승식별효과.재진실미박수거상적실험표명,해방법능구유효지완성중문미박적명명실체식별임무.