计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2005年
4期
35-37,133
,共4页
HMM%百科辞典知识获取%自然语言处理
HMM%百科辭典知識穫取%自然語言處理
HMM%백과사전지식획취%자연어언처리
在百科全书条目文本中,往往以几个不同的侧面说明一个条目,一个侧面构成有关这一条目的一个知识点.知识点是一般文本处理领域中话题这一概念在百科全书文本中的具体表现.属于同一个类型的条目文本中总是重复出现有限的几个知识点,这些知识点构成了有关该类型的知识点集合,并且这些知识点在该类型不同的条目文本中的分布有较强的规律性.在条目文本中识别出对应的知识点序列是百科全书中知识提取过程的重要一环.该文提出了一种基于隐马尔科夫(HMM)模型的方法,利用知识点在条目文本中的转移规律以及知识点的词特征分布来判断每个句子的知识点类别.实验表明这个方法能取得较好的结果,在<中国大百科全书>地理卷的中国县市类型的条目文本中的实验结果的正确率为91.8%.
在百科全書條目文本中,往往以幾箇不同的側麵說明一箇條目,一箇側麵構成有關這一條目的一箇知識點.知識點是一般文本處理領域中話題這一概唸在百科全書文本中的具體錶現.屬于同一箇類型的條目文本中總是重複齣現有限的幾箇知識點,這些知識點構成瞭有關該類型的知識點集閤,併且這些知識點在該類型不同的條目文本中的分佈有較彊的規律性.在條目文本中識彆齣對應的知識點序列是百科全書中知識提取過程的重要一環.該文提齣瞭一種基于隱馬爾科伕(HMM)模型的方法,利用知識點在條目文本中的轉移規律以及知識點的詞特徵分佈來判斷每箇句子的知識點類彆.實驗錶明這箇方法能取得較好的結果,在<中國大百科全書>地理捲的中國縣市類型的條目文本中的實驗結果的正確率為91.8%.
재백과전서조목문본중,왕왕이궤개불동적측면설명일개조목,일개측면구성유관저일조목적일개지식점.지식점시일반문본처리영역중화제저일개념재백과전서문본중적구체표현.속우동일개류형적조목문본중총시중복출현유한적궤개지식점,저사지식점구성료유관해류형적지식점집합,병차저사지식점재해류형불동적조목문본중적분포유교강적규률성.재조목문본중식별출대응적지식점서렬시백과전서중지식제취과정적중요일배.해문제출료일충기우은마이과부(HMM)모형적방법,이용지식점재조목문본중적전이규률이급지식점적사특정분포래판단매개구자적지식점유별.실험표명저개방법능취득교호적결과,재<중국대백과전서>지리권적중국현시류형적조목문본중적실험결과적정학솔위91.8%.