情报杂志
情報雜誌
정보잡지
JOURNAL OF INFORMATION
2008年
3期
96-98
,共3页
聚类%信息提取%隐马尔可夫模型
聚類%信息提取%隱馬爾可伕模型
취류%신식제취%은마이가부모형
为了通过统计的学习来得到最优的模型参数,我们通过基于形式的聚类方法将训练数据聚成几个类,每个类的数据被用来训练一个初始概率和一个转移概率矩阵.在进行文本信息提取时,结合每一个初始概率矩阵、每一个转移概率矩阵,使用Viterbi算法来找出最优的标记序列.结果这些最优的标记序列中概率最大的标记序列将被作为最终输出.实验表明,新的算法在一定条件下能提高文本信息提取的精确度和召回率.
為瞭通過統計的學習來得到最優的模型參數,我們通過基于形式的聚類方法將訓練數據聚成幾箇類,每箇類的數據被用來訓練一箇初始概率和一箇轉移概率矩陣.在進行文本信息提取時,結閤每一箇初始概率矩陣、每一箇轉移概率矩陣,使用Viterbi算法來找齣最優的標記序列.結果這些最優的標記序列中概率最大的標記序列將被作為最終輸齣.實驗錶明,新的算法在一定條件下能提高文本信息提取的精確度和召迴率.
위료통과통계적학습래득도최우적모형삼수,아문통과기우형식적취류방법장훈련수거취성궤개류,매개류적수거피용래훈련일개초시개솔화일개전이개솔구진.재진행문본신식제취시,결합매일개초시개솔구진、매일개전이개솔구진,사용Viterbi산법래조출최우적표기서렬.결과저사최우적표기서렬중개솔최대적표기서렬장피작위최종수출.실험표명,신적산법재일정조건하능제고문본신식제취적정학도화소회솔.