软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2008年
3期
621-629
,共9页
文本提取%高斯混合模型%判别学习%最大-最小相似度学习%最小分类错误学习
文本提取%高斯混閤模型%判彆學習%最大-最小相似度學習%最小分類錯誤學習
문본제취%고사혼합모형%판별학습%최대-최소상사도학습%최소분류착오학습
应用最大-最小相似度(maximum-minimum similafity,简称MMS)学习方法,对基于高斯混合模型的文本区域提取方法中的有关参数进行优化.该学习方法通过最大化正样本相似度和最小化反样本相似度获得最佳分类能力.根据这种判别学习思想,建立了相应的目标函数,并利用最速梯度下降法寻找目标函数最小值,以得到文本区域提取方法的最优参数集合.文本区域提取实验结果表明:在用期望最大化(expectation maximization,简称EM)算法获得参数的极大似然估计值后,使用最大-最小相似度学习方法,使文本提取综合性能明显提高,开放实验的召回率和准确率分别达到98.55%和93.56%.在实验中,最大-最小相似度学习方法的表现还优于常用的判别学习方法--最小分类错误(minimum classification error,简称MCE)学习方法.
應用最大-最小相似度(maximum-minimum similafity,簡稱MMS)學習方法,對基于高斯混閤模型的文本區域提取方法中的有關參數進行優化.該學習方法通過最大化正樣本相似度和最小化反樣本相似度穫得最佳分類能力.根據這種判彆學習思想,建立瞭相應的目標函數,併利用最速梯度下降法尋找目標函數最小值,以得到文本區域提取方法的最優參數集閤.文本區域提取實驗結果錶明:在用期望最大化(expectation maximization,簡稱EM)算法穫得參數的極大似然估計值後,使用最大-最小相似度學習方法,使文本提取綜閤性能明顯提高,開放實驗的召迴率和準確率分彆達到98.55%和93.56%.在實驗中,最大-最小相似度學習方法的錶現還優于常用的判彆學習方法--最小分類錯誤(minimum classification error,簡稱MCE)學習方法.
응용최대-최소상사도(maximum-minimum similafity,간칭MMS)학습방법,대기우고사혼합모형적문본구역제취방법중적유관삼수진행우화.해학습방법통과최대화정양본상사도화최소화반양본상사도획득최가분류능력.근거저충판별학습사상,건립료상응적목표함수,병이용최속제도하강법심조목표함수최소치,이득도문본구역제취방법적최우삼수집합.문본구역제취실험결과표명:재용기망최대화(expectation maximization,간칭EM)산법획득삼수적겁대사연고계치후,사용최대-최소상사도학습방법,사문본제취종합성능명현제고,개방실험적소회솔화준학솔분별체도98.55%화93.56%.재실험중,최대-최소상사도학습방법적표현환우우상용적판별학습방법--최소분류착오(minimum classification error,간칭MCE)학습방법.