计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2004年
6期
18-22
,共5页
科技论文%文本分类%层次结构%精度%泛化
科技論文%文本分類%層次結構%精度%汎化
과기논문%문본분류%층차결구%정도%범화
互联网和科学研究的高速发展导致可利用的科技文献的数量急剧增加,为了更有效地利用这些文献、特别是英文文献,迫切需要对它们进行机器自动分类.传统的文本分类算法没有考虑科技文本具有明显层次结构的这一特征,在进行分类时无法达到满意的效果.论文针对这一特征提出了一种基于层次结构的文本分类模型,并对环境类科技论文进行了分类研究.结果表明,该模型能够稳定并有效地提高分类的精度,提高的幅度在1%到24%之间;同时,该模型还具有良好的泛化能力.
互聯網和科學研究的高速髮展導緻可利用的科技文獻的數量急劇增加,為瞭更有效地利用這些文獻、特彆是英文文獻,迫切需要對它們進行機器自動分類.傳統的文本分類算法沒有攷慮科技文本具有明顯層次結構的這一特徵,在進行分類時無法達到滿意的效果.論文針對這一特徵提齣瞭一種基于層次結構的文本分類模型,併對環境類科技論文進行瞭分類研究.結果錶明,該模型能夠穩定併有效地提高分類的精度,提高的幅度在1%到24%之間;同時,該模型還具有良好的汎化能力.
호련망화과학연구적고속발전도치가이용적과기문헌적수량급극증가,위료경유효지이용저사문헌、특별시영문문헌,박절수요대타문진행궤기자동분류.전통적문본분류산법몰유고필과기문본구유명현층차결구적저일특정,재진행분류시무법체도만의적효과.논문침대저일특정제출료일충기우층차결구적문본분류모형,병대배경류과기논문진행료분류연구.결과표명,해모형능구은정병유효지제고분류적정도,제고적폭도재1%도24%지간;동시,해모형환구유량호적범화능력.