殷都学刊
慇都學刊
은도학간
Yindu Journal
2010年
1期
24~28
,共null页
毛延辉 张涛 唐际根 郭志伟
毛延輝 張濤 唐際根 郭誌偉
모연휘 장도 당제근 곽지위
数据挖掘 决策树 C4.5分类算法 领域知识 等价无穷小
數據挖掘 決策樹 C4.5分類算法 領域知識 等價無窮小
수거알굴 결책수 C4.5분류산법 영역지식 등개무궁소
data mining; decision-tree; C4.5 sorting arithmetic; field; equivalent infinitesimal
数据挖掘技术是在近来信息化进程的发展和人们对信息需求的快速增加的大背景下应运而生的一项新技术。考古研究的进步使得找寻考古数据之间关系、并以此为途径研究其背后的社会和历史发展规律成为主题,将数据挖掘技术引入考古研究领域正好顺应了这一大趋势。决策树算法是典型的数据挖掘中的分类算法。为了适应考古研究的具体要求,我们基于C4.5算法,提出了两点改进:增加了一个表示研究背景的参数向量以改进决策树算法无法充分利用先验背景的确定;改变了分裂判定准则——信息增益率的计算方法以提高算法运行速度。经过检验二者都获得了较好的效果。
數據挖掘技術是在近來信息化進程的髮展和人們對信息需求的快速增加的大揹景下應運而生的一項新技術。攷古研究的進步使得找尋攷古數據之間關繫、併以此為途徑研究其揹後的社會和歷史髮展規律成為主題,將數據挖掘技術引入攷古研究領域正好順應瞭這一大趨勢。決策樹算法是典型的數據挖掘中的分類算法。為瞭適應攷古研究的具體要求,我們基于C4.5算法,提齣瞭兩點改進:增加瞭一箇錶示研究揹景的參數嚮量以改進決策樹算法無法充分利用先驗揹景的確定;改變瞭分裂判定準則——信息增益率的計算方法以提高算法運行速度。經過檢驗二者都穫得瞭較好的效果。
수거알굴기술시재근래신식화진정적발전화인문대신식수구적쾌속증가적대배경하응운이생적일항신기술。고고연구적진보사득조심고고수거지간관계、병이차위도경연구기배후적사회화역사발전규률성위주제,장수거알굴기술인입고고연구영역정호순응료저일대추세。결책수산법시전형적수거알굴중적분류산법。위료괄응고고연구적구체요구,아문기우C4.5산법,제출료량점개진:증가료일개표시연구배경적삼수향량이개진결책수산법무법충분이용선험배경적학정;개변료분렬판정준칙——신식증익솔적계산방법이제고산법운행속도。경과검험이자도획득료교호적효과。
Data mining is a new technology based on the development of informationization and people's increasing demand for information.The progress in archaeological research makes it a main task to find out the relationship among archaeological data and,accordingly,to study the hidden rules of social and historical development.The application of data mining to archaeology follows the trend.Decision-tree is a typical sorting arithmetic in data mining.