情报学报
情報學報
정보학보
2012年
12期
1259-1264
,共6页
维基百科%信息质量%质量评价%分类模型
維基百科%信息質量%質量評價%分類模型
유기백과%신식질량%질량평개%분류모형
采用开放协同编辑模式的维基百科,其内容的精确性一直受到人们的质疑.除了极少部分被维基百科认定为高质量文章外,维基用户很难判断其余大部分文章的质量.对此,本文将维基百科中页面信息作为样本数据,把页面信息质量评价问题抽象为一个分类问题,构造了基于决策树C4.5的维基百科页面信息质量评价模型.并从页面编辑者情况和页面情况两个方面提出影响维基百科页面信息质量的15个的指标,给出了各指标的定义以及计算公式.最后,训练一个自动的页面信息质量分级评价模型并进行了有效性验证.实验证明,本文提出的维基百科页面信息质量分级评价模型能有效预测页面信息质量等级.
採用開放協同編輯模式的維基百科,其內容的精確性一直受到人們的質疑.除瞭極少部分被維基百科認定為高質量文章外,維基用戶很難判斷其餘大部分文章的質量.對此,本文將維基百科中頁麵信息作為樣本數據,把頁麵信息質量評價問題抽象為一箇分類問題,構造瞭基于決策樹C4.5的維基百科頁麵信息質量評價模型.併從頁麵編輯者情況和頁麵情況兩箇方麵提齣影響維基百科頁麵信息質量的15箇的指標,給齣瞭各指標的定義以及計算公式.最後,訓練一箇自動的頁麵信息質量分級評價模型併進行瞭有效性驗證.實驗證明,本文提齣的維基百科頁麵信息質量分級評價模型能有效預測頁麵信息質量等級.
채용개방협동편집모식적유기백과,기내용적정학성일직수도인문적질의.제료겁소부분피유기백과인정위고질량문장외,유기용호흔난판단기여대부분문장적질량.대차,본문장유기백과중혈면신식작위양본수거,파혈면신식질량평개문제추상위일개분류문제,구조료기우결책수C4.5적유기백과혈면신식질량평개모형.병종혈면편집자정황화혈면정황량개방면제출영향유기백과혈면신식질량적15개적지표,급출료각지표적정의이급계산공식.최후,훈련일개자동적혈면신식질량분급평개모형병진행료유효성험증.실험증명,본문제출적유기백과혈면신식질량분급평개모형능유효예측혈면신식질량등급.