计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2011年
12期
182-186,199
,共6页
尹美娟%陈庶民%刘晓楠%路林
尹美娟%陳庶民%劉曉楠%路林
윤미연%진서민%류효남%로림
实体解析%邮件正文%别名抽取%称呼块签名块定位%别名边界词汇模板
實體解析%郵件正文%彆名抽取%稱呼塊籤名塊定位%彆名邊界詞彙模闆
실체해석%유건정문%별명추취%칭호괴첨명괴정위%별명변계사회모판
邮箱用户身份信息挖掘是数据挖掘研究的一个热点.当前相关研究大多仅从邮件头中抽取邮箱用户的别名,遗漏了邮件正文中潜藏的更能代表通信双方身份的别名信息.针对纯文本邮件正文中邮箱用户别名信息抽取问题,提出了基于统计和规则过滤的称呼块和签名决定位算法,该算法能高效准确地从邮件正文中提取出蕴涵邮箱用户别名的称呼块和签名块文本片段;进一步提出了基于别名边界词汇模板修正的别名抽取方法,从而提高了仅基于命名实体识别或词性标注工具识别别名的准确率.实验结果表明,提出的方法可以有效地抽取出邮件正文中邮箱用户的别名.
郵箱用戶身份信息挖掘是數據挖掘研究的一箇熱點.噹前相關研究大多僅從郵件頭中抽取郵箱用戶的彆名,遺漏瞭郵件正文中潛藏的更能代錶通信雙方身份的彆名信息.針對純文本郵件正文中郵箱用戶彆名信息抽取問題,提齣瞭基于統計和規則過濾的稱呼塊和籤名決定位算法,該算法能高效準確地從郵件正文中提取齣蘊涵郵箱用戶彆名的稱呼塊和籤名塊文本片段;進一步提齣瞭基于彆名邊界詞彙模闆脩正的彆名抽取方法,從而提高瞭僅基于命名實體識彆或詞性標註工具識彆彆名的準確率.實驗結果錶明,提齣的方法可以有效地抽取齣郵件正文中郵箱用戶的彆名.
유상용호신빈신식알굴시수거알굴연구적일개열점.당전상관연구대다부종유건두중추취유상용호적별명,유루료유건정문중잠장적경능대표통신쌍방신빈적별명신식.침대순문본유건정문중유상용호별명신식추취문제,제출료기우통계화규칙과려적칭호괴화첨명결정위산법,해산법능고효준학지종유건정문중제취출온함유상용호별명적칭호괴화첨명괴문본편단;진일보제출료기우별명변계사회모판수정적별명추취방법,종이제고료부기우명명실체식별혹사성표주공구식별별명적준학솔.실험결과표명,제출적방법가이유효지추취출유건정문중유상용호적별명.