情报学报
情報學報
정보학보
2012年
8期
805-812
,共8页
段宇锋%黑珍珍%鞠菲%崔红
段宇鋒%黑珍珍%鞠菲%崔紅
단우봉%흑진진%국비%최홍
朴素贝叶斯%先导词%物种描述文本%语义标注
樸素貝葉斯%先導詞%物種描述文本%語義標註
박소패협사%선도사%물충묘술문본%어의표주
本研究从<中国植物志>中随机采集1000个文档作为数据集,采用基于先导词的朴素贝叶斯算法实现中文物种描述文本的自动语义标注.通过实验性研究,实验数据表明,先导词能够有效提升朴素贝叶斯的标注效率.采用先导词后,F平均值提高0 048~0 107,尤以Fr为2时效果最好,整体标注性能F平均值高达0 902.各元素的标注性能也较为理想.Fr分别取1、2、3时,大部分元素的F值为0 730~0 964.
本研究從<中國植物誌>中隨機採集1000箇文檔作為數據集,採用基于先導詞的樸素貝葉斯算法實現中文物種描述文本的自動語義標註.通過實驗性研究,實驗數據錶明,先導詞能夠有效提升樸素貝葉斯的標註效率.採用先導詞後,F平均值提高0 048~0 107,尤以Fr為2時效果最好,整體標註性能F平均值高達0 902.各元素的標註性能也較為理想.Fr分彆取1、2、3時,大部分元素的F值為0 730~0 964.
본연구종<중국식물지>중수궤채집1000개문당작위수거집,채용기우선도사적박소패협사산법실현중문물충묘술문본적자동어의표주.통과실험성연구,실험수거표명,선도사능구유효제승박소패협사적표주효솔.채용선도사후,F평균치제고0 048~0 107,우이Fr위2시효과최호,정체표주성능F평균치고체0 902.각원소적표주성능야교위이상.Fr분별취1、2、3시,대부분원소적F치위0 730~0 964.