情报学报
情報學報
정보학보
2013年
9期
1000-1008
,共9页
电子文献分类%机器学习%支持向量机%L2空间%小波分析
電子文獻分類%機器學習%支持嚮量機%L2空間%小波分析
전자문헌분류%궤기학습%지지향량궤%L2공간%소파분석
文献数据的自动化分类,将在数字图书馆中占据越来越重要的地位.一般采用基于支持向量机的核方法,在标准测试集合上进行文献数据分类,具有某些不足.该方法存在文献向量规模庞大、核函数非正交且多义、重现率计算耗时等缺陷;不使用数字图书馆的真实数据测试,算法的实际说服力不强.为了解决这些问题,采用词汇扩展对文献向量进行预处理,得到少而精、正交无歧义的新文献向量;对文献向量按照语义排序,提高访问和计算速度;借助小波核将文献映射到L2空间进行文献分类.采用中国学术期刊网的真实分类数据,从摘要信息和全文文献两个角度进行验证,结果表明该方法优于核方法,具有一定的理论研究和实际应用价值.
文獻數據的自動化分類,將在數字圖書館中佔據越來越重要的地位.一般採用基于支持嚮量機的覈方法,在標準測試集閤上進行文獻數據分類,具有某些不足.該方法存在文獻嚮量規模龐大、覈函數非正交且多義、重現率計算耗時等缺陷;不使用數字圖書館的真實數據測試,算法的實際說服力不彊.為瞭解決這些問題,採用詞彙擴展對文獻嚮量進行預處理,得到少而精、正交無歧義的新文獻嚮量;對文獻嚮量按照語義排序,提高訪問和計算速度;藉助小波覈將文獻映射到L2空間進行文獻分類.採用中國學術期刊網的真實分類數據,從摘要信息和全文文獻兩箇角度進行驗證,結果錶明該方法優于覈方法,具有一定的理論研究和實際應用價值.
문헌수거적자동화분류,장재수자도서관중점거월래월중요적지위.일반채용기우지지향량궤적핵방법,재표준측시집합상진행문헌수거분류,구유모사불족.해방법존재문헌향량규모방대、핵함수비정교차다의、중현솔계산모시등결함;불사용수자도서관적진실수거측시,산법적실제설복력불강.위료해결저사문제,채용사회확전대문헌향량진행예처리,득도소이정、정교무기의적신문헌향량;대문헌향량안조어의배서,제고방문화계산속도;차조소파핵장문헌영사도L2공간진행문헌분류.채용중국학술기간망적진실분류수거,종적요신식화전문문헌량개각도진행험증,결과표명해방법우우핵방법,구유일정적이론연구화실제응용개치.