微型机与应用
微型機與應用
미형궤여응용
MICROCOMPUTER & ITS APPLICATIONS
2015年
7期
75-78
,共4页
Deep Web%数据集成%特征提取%dirichlet过程%混合模型
Deep Web%數據集成%特徵提取%dirichlet過程%混閤模型
Deep Web%수거집성%특정제취%dirichlet과정%혼합모형
提出了一种基于Dirichlet过程的Deep Web数据源聚类方法,该方法采用层次Dirichlet过程(HDP)进行特征提取.首先将查询接口中原本高维稀疏的文本表示为主题特征,该过程能自动确定特征数.然后将文本看成多项式模型,采用Dirichlet过程混合模型聚类.该模型无需人工事先指定聚类个数,由Dirichlet过程根据数据自动计算得到,特别适用于Deep Web数据源数量大、变化快的特点.在通用数据集TEL-8上进行验证实验,并与其他聚类方法在F-measure和熵值两个指标上进行对比,均取得较好的结果.
提齣瞭一種基于Dirichlet過程的Deep Web數據源聚類方法,該方法採用層次Dirichlet過程(HDP)進行特徵提取.首先將查詢接口中原本高維稀疏的文本錶示為主題特徵,該過程能自動確定特徵數.然後將文本看成多項式模型,採用Dirichlet過程混閤模型聚類.該模型無需人工事先指定聚類箇數,由Dirichlet過程根據數據自動計算得到,特彆適用于Deep Web數據源數量大、變化快的特點.在通用數據集TEL-8上進行驗證實驗,併與其他聚類方法在F-measure和熵值兩箇指標上進行對比,均取得較好的結果.
제출료일충기우Dirichlet과정적Deep Web수거원취류방법,해방법채용층차Dirichlet과정(HDP)진행특정제취.수선장사순접구중원본고유희소적문본표시위주제특정,해과정능자동학정특정수.연후장문본간성다항식모형,채용Dirichlet과정혼합모형취류.해모형무수인공사선지정취류개수,유Dirichlet과정근거수거자동계산득도,특별괄용우Deep Web수거원수량대、변화쾌적특점.재통용수거집TEL-8상진행험증실험,병여기타취류방법재F-measure화적치량개지표상진행대비,균취득교호적결과.