计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2008年
9期
2679-2683
,共5页
数据清洗%最大熵%马尔可夫模型%重叠特征
數據清洗%最大熵%馬爾可伕模型%重疊特徵
수거청세%최대적%마이가부모형%중첩특정
针对数据清洗时数据的标准化问题提出采用基于特征的马尔可夫模型来解决这一问题.在学习模型的过程中,通过最大熵方法提高样本学习的泛化能力.这种方法能够充分利用数据的重叠特征来辨识数据项对应的状态,结合了统计模型和规则模型的优点.理论分析和实验表明,该方法可以有效地实现数据清洗时的数据规格化.
針對數據清洗時數據的標準化問題提齣採用基于特徵的馬爾可伕模型來解決這一問題.在學習模型的過程中,通過最大熵方法提高樣本學習的汎化能力.這種方法能夠充分利用數據的重疊特徵來辨識數據項對應的狀態,結閤瞭統計模型和規則模型的優點.理論分析和實驗錶明,該方法可以有效地實現數據清洗時的數據規格化.
침대수거청세시수거적표준화문제제출채용기우특정적마이가부모형래해결저일문제.재학습모형적과정중,통과최대적방법제고양본학습적범화능력.저충방법능구충분이용수거적중첩특정래변식수거항대응적상태,결합료통계모형화규칙모형적우점.이론분석화실험표명,해방법가이유효지실현수거청세시적수거규격화.