标准科学
標準科學
표준과학
STANDARD SCIENCE
2012年
1期
93-96
,共4页
经营范围%经济活动%行业类别%文本分类
經營範圍%經濟活動%行業類彆%文本分類
경영범위%경제활동%행업유별%문본분류
随着各种数字化信息不断增长,如何对大量文档信息进行科学归类成为亟待解决的问题.文本自动分类方法成为目前解决该问题的一项关键技术.我国目前有超过1,000万的企业,企业经营范围是企业从事经营活动的具体描述.本文以企业经营范围数据为基础,根据其结构特征,以及与经济行业的关系,利用大规模文本数据的切分词优化、统计分类推断、属性关联分析等关键技术,通过在组织机构代码数据库中提炼相关数据进行实验比对分析,从而得出一种实用、高效的企业经营范围的文本自动分类方法.
隨著各種數字化信息不斷增長,如何對大量文檔信息進行科學歸類成為亟待解決的問題.文本自動分類方法成為目前解決該問題的一項關鍵技術.我國目前有超過1,000萬的企業,企業經營範圍是企業從事經營活動的具體描述.本文以企業經營範圍數據為基礎,根據其結構特徵,以及與經濟行業的關繫,利用大規模文本數據的切分詞優化、統計分類推斷、屬性關聯分析等關鍵技術,通過在組織機構代碼數據庫中提煉相關數據進行實驗比對分析,從而得齣一種實用、高效的企業經營範圍的文本自動分類方法.
수착각충수자화신식불단증장,여하대대량문당신식진행과학귀류성위극대해결적문제.문본자동분류방법성위목전해결해문제적일항관건기술.아국목전유초과1,000만적기업,기업경영범위시기업종사경영활동적구체묘술.본문이기업경영범위수거위기출,근거기결구특정,이급여경제행업적관계,이용대규모문본수거적절분사우화、통계분유추단、속성관련분석등관건기술,통과재조직궤구대마수거고중제련상관수거진행실험비대분석,종이득출일충실용、고효적기업경영범위적문본자동분류방법.