科技进步与对策
科技進步與對策
과기진보여대책
SCIENCE & TECHNOLOGY PROGRESS AND POLICY
2014年
11期
81-85,86
,共6页
胡东滨%李雪%徐丽华
鬍東濱%李雪%徐麗華
호동빈%리설%서려화
动态风险评价%文本挖掘%特征选择
動態風險評價%文本挖掘%特徵選擇
동태풍험평개%문본알굴%특정선택
风险分析是海外矿产资源开发项目成败的关键。已有研究显示不断迅速更新的、含大量信息的文本数据,可以通过文本分类动态评价海外矿业投资项目风险。文本分类作为文本挖掘的重要应用,其能否取得较好的分类效果,对特征集进行降维处理成为关键环节。在研究常用特征选择方法的基础上,利用词频及特征项的类别分布信息,改进原有的频度、类间集中度、类内分散度3个指标,提出新的特征选择方法TFTD。实验采用朴素贝叶斯、KNN、SVM 分类器,并将信息增益(IG)、χ2统计量(CHI)、文档频率(DF)、基尼指数(Gini index)与 TFTD方法进行比较,结果表明 TFTD的特征降维处理可以在分类器上获得较好的分类效果。
風險分析是海外礦產資源開髮項目成敗的關鍵。已有研究顯示不斷迅速更新的、含大量信息的文本數據,可以通過文本分類動態評價海外礦業投資項目風險。文本分類作為文本挖掘的重要應用,其能否取得較好的分類效果,對特徵集進行降維處理成為關鍵環節。在研究常用特徵選擇方法的基礎上,利用詞頻及特徵項的類彆分佈信息,改進原有的頻度、類間集中度、類內分散度3箇指標,提齣新的特徵選擇方法TFTD。實驗採用樸素貝葉斯、KNN、SVM 分類器,併將信息增益(IG)、χ2統計量(CHI)、文檔頻率(DF)、基尼指數(Gini index)與 TFTD方法進行比較,結果錶明 TFTD的特徵降維處理可以在分類器上穫得較好的分類效果。
풍험분석시해외광산자원개발항목성패적관건。이유연구현시불단신속경신적、함대량신식적문본수거,가이통과문본분류동태평개해외광업투자항목풍험。문본분류작위문본알굴적중요응용,기능부취득교호적분류효과,대특정집진행강유처리성위관건배절。재연구상용특정선택방법적기출상,이용사빈급특정항적유별분포신식,개진원유적빈도、류간집중도、류내분산도3개지표,제출신적특정선택방법TFTD。실험채용박소패협사、KNN、SVM 분류기,병장신식증익(IG)、χ2통계량(CHI)、문당빈솔(DF)、기니지수(Gini index)여 TFTD방법진행비교,결과표명 TFTD적특정강유처리가이재분류기상획득교호적분류효과。