电子学报
電子學報
전자학보
ACTA ELECTRONICA SINICA
2000年
8期
110-112
,共3页
黄萱菁%吴立德%郭以昆%刘秉伟
黃萱菁%吳立德%郭以昆%劉秉偉
황훤정%오립덕%곽이곤%류병위
熵%困惑度%统计语言模型
熵%睏惑度%統計語言模型
적%곤혹도%통계어언모형
本文在大规模语料的基础上,利用语言模型中稀疏事件的概率估计方法对汉语的熵进行计算,并讨论了语料规模等因素对熵的影响.在4年的人民日报的语料规模下,所求得的零阶熵、一阶熵、二阶熵分别为9.62,6.18和4.89比特.
本文在大規模語料的基礎上,利用語言模型中稀疏事件的概率估計方法對漢語的熵進行計算,併討論瞭語料規模等因素對熵的影響.在4年的人民日報的語料規模下,所求得的零階熵、一階熵、二階熵分彆為9.62,6.18和4.89比特.
본문재대규모어료적기출상,이용어언모형중희소사건적개솔고계방법대한어적적진행계산,병토론료어료규모등인소대적적영향.재4년적인민일보적어료규모하,소구득적령계적、일계적、이계적분별위9.62,6.18화4.89비특.