小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2014年
1期
60-63
,共4页
OA期刊%网页分类%TF*IDF%支持向量机%有向无环图
OA期刊%網頁分類%TF*IDF%支持嚮量機%有嚮無環圖
OA기간%망혈분류%TF*IDF%지지향량궤%유향무배도
open access journal%web page classification%TF * IDF%support vector machine%directed acyclic graph
开放存取(OA)期刊站点的自动分类是整合OA期刊论文资源建立数字资源库的前提.文中提出一种基于网页标签内特征词的OA期刊站点自动分类方法.首先.抽取网页不同HMTL标签中的词构建语料库,将网页中不同的标签赋予不同的权值,并提出了最优权值计算算法,据此对TF* IDF计算模型进行改进,从而计算特征词权值得到文本向量表示;然后,计算每两个类别的最小欧氏距离,取最小欧氏距离较大的一对类别构建上层分类节点,对有向无环图支持向量机(DAG-SVM)的构建过程进行改进;最后,利用改进的DAG-SVM对OA期刊站点进行分类.实验结果表明,该方法具有较好的分类效果.
開放存取(OA)期刊站點的自動分類是整閤OA期刊論文資源建立數字資源庫的前提.文中提齣一種基于網頁標籤內特徵詞的OA期刊站點自動分類方法.首先.抽取網頁不同HMTL標籤中的詞構建語料庫,將網頁中不同的標籤賦予不同的權值,併提齣瞭最優權值計算算法,據此對TF* IDF計算模型進行改進,從而計算特徵詞權值得到文本嚮量錶示;然後,計算每兩箇類彆的最小歐氏距離,取最小歐氏距離較大的一對類彆構建上層分類節點,對有嚮無環圖支持嚮量機(DAG-SVM)的構建過程進行改進;最後,利用改進的DAG-SVM對OA期刊站點進行分類.實驗結果錶明,該方法具有較好的分類效果.
개방존취(OA)기간참점적자동분류시정합OA기간논문자원건립수자자원고적전제.문중제출일충기우망혈표첨내특정사적OA기간참점자동분류방법.수선.추취망혈불동HMTL표첨중적사구건어료고,장망혈중불동적표첨부여불동적권치,병제출료최우권치계산산법,거차대TF* IDF계산모형진행개진,종이계산특정사권치득도문본향량표시;연후,계산매량개유별적최소구씨거리,취최소구씨거리교대적일대유별구건상층분류절점,대유향무배도지지향량궤(DAG-SVM)적구건과정진행개진;최후,이용개진적DAG-SVM대OA기간참점진행분류.실험결과표명,해방법구유교호적분류효과.