计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2011年
12期
26-28,32
,共4页
产品评论%生词识别%序列模板%属性词
產品評論%生詞識彆%序列模闆%屬性詞
산품평론%생사식별%서렬모판%속성사
针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词短语模板、动词和动词短语模板,采用统计技术和自然语言处理技术筛选候选属性词.实验结果表明,对于3 623篇手机评论文章,利用该方法可获得1 732个属性词,准确率为0.565、召回率为0.726、调和平均值为0.636,具有较好的抽取性能.
針對現有屬性詞抽取方法的準確率和覆蓋率偏低問題,利用百度百科和分詞後相鄰詞語同現比例識彆專業領域生詞,降低分詞錯誤對屬性詞識彆的影響,在中文產品評論語料中通過設計詞性序列模闆穫得候選屬性詞集,該詞性序列模闆包含名詞和名詞短語模闆、動詞和動詞短語模闆,採用統計技術和自然語言處理技術篩選候選屬性詞.實驗結果錶明,對于3 623篇手機評論文章,利用該方法可穫得1 732箇屬性詞,準確率為0.565、召迴率為0.726、調和平均值為0.636,具有較好的抽取性能.
침대현유속성사추취방법적준학솔화복개솔편저문제,이용백도백과화분사후상린사어동현비례식별전업영역생사,강저분사착오대속성사식별적영향,재중문산품평론어료중통과설계사성서렬모판획득후선속성사집,해사성서렬모판포함명사화명사단어모판、동사화동사단어모판,채용통계기술화자연어언처리기술사선후선속성사.실험결과표명,대우3 623편수궤평논문장,이용해방법가획득1 732개속성사,준학솔위0.565、소회솔위0.726、조화평균치위0.636,구유교호적추취성능.