情报学报
情報學報
정보학보
2014年
1期
45-54
,共10页
潜在主题%可视化%多维尺度模型%数据编码
潛在主題%可視化%多維呎度模型%數據編碼
잠재주제%가시화%다유척도모형%수거편마
数据库内容结构分析把共词分析方法应用于全文主题发现,但事先选定种子词和统计共现次数等步骤导致该方法会遗漏很多重要的词汇组合和潜在主题.本文提出使用词汇集聚理论作为潜在主题可视化的理论基础,跳过事先选定种子词和统计共现矩阵的步骤,把词条表示在转置的向量空间中,通过多维尺度模型(MDS)算法把词条在转置向量空间中的邻近关系投影到三维空间图上,通过词汇的空间聚类来发现和表示潜在主题;引入数据编码的方法来克服MDS可视空间容量的局限,并设计了邻近矩阵、质心邻近矩阵、属性叠加邻近矩阵及三个层次的方法流程.最后,成功地将三个层次的潜在主题可视化的方法流程应用于计算机应用服务业上市公司的风险识别.
數據庫內容結構分析把共詞分析方法應用于全文主題髮現,但事先選定種子詞和統計共現次數等步驟導緻該方法會遺漏很多重要的詞彙組閤和潛在主題.本文提齣使用詞彙集聚理論作為潛在主題可視化的理論基礎,跳過事先選定種子詞和統計共現矩陣的步驟,把詞條錶示在轉置的嚮量空間中,通過多維呎度模型(MDS)算法把詞條在轉置嚮量空間中的鄰近關繫投影到三維空間圖上,通過詞彙的空間聚類來髮現和錶示潛在主題;引入數據編碼的方法來剋服MDS可視空間容量的跼限,併設計瞭鄰近矩陣、質心鄰近矩陣、屬性疊加鄰近矩陣及三箇層次的方法流程.最後,成功地將三箇層次的潛在主題可視化的方法流程應用于計算機應用服務業上市公司的風險識彆.
수거고내용결구분석파공사분석방법응용우전문주제발현,단사선선정충자사화통계공현차수등보취도치해방법회유루흔다중요적사회조합화잠재주제.본문제출사용사회집취이론작위잠재주제가시화적이론기출,도과사선선정충자사화통계공현구진적보취,파사조표시재전치적향량공간중,통과다유척도모형(MDS)산법파사조재전치향량공간중적린근관계투영도삼유공간도상,통과사회적공간취류래발현화표시잠재주제;인입수거편마적방법래극복MDS가시공간용량적국한,병설계료린근구진、질심린근구진、속성첩가린근구진급삼개층차적방법류정.최후,성공지장삼개층차적잠재주제가시화적방법류정응용우계산궤응용복무업상시공사적풍험식별.