中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2009年
5期
47-52
,共6页
郭剑毅%薛征山%余正涛%张志坤%张宜浩%姚贤明
郭劍毅%薛徵山%餘正濤%張誌坤%張宜浩%姚賢明
곽검의%설정산%여정도%장지곤%장의호%요현명
计算机应用%中文信息处理%旅游领域%命名实体识别%层叠条件随机场%特征模板
計算機應用%中文信息處理%旅遊領域%命名實體識彆%層疊條件隨機場%特徵模闆
계산궤응용%중문신식처리%여유영역%명명실체식별%층첩조건수궤장%특정모판
针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法.该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到高层模型,以词为切分粒度,结合复杂特征,实现嵌套景点、特产风味、地点的识别.最后进行了两组相关实验,结果表明,在开放测试中,层叠条件随机场模型相比于单层模型,F值提高了8个百分点;相比于HMM模型,正确率提高了8个百分点,召回率提高了22个百分点,F值提高了15个百分点.
針對旅遊領域,提齣瞭一種基于層疊條件隨機場模型的旅遊領域命名實體識彆方法.該方法在低層條件隨機場中以字為切分粒度,結閤旅遊景點常用字錶、景點常用後綴錶、地名常用字錶等特徵詞典,實現簡單旅遊命名實體的識彆;其識彆結果傳遞到高層模型,以詞為切分粒度,結閤複雜特徵,實現嵌套景點、特產風味、地點的識彆.最後進行瞭兩組相關實驗,結果錶明,在開放測試中,層疊條件隨機場模型相比于單層模型,F值提高瞭8箇百分點;相比于HMM模型,正確率提高瞭8箇百分點,召迴率提高瞭22箇百分點,F值提高瞭15箇百分點.
침대여유영역,제출료일충기우층첩조건수궤장모형적여유영역명명실체식별방법.해방법재저층조건수궤장중이자위절분립도,결합여유경점상용자표、경점상용후철표、지명상용자표등특정사전,실현간단여유명명실체적식별;기식별결과전체도고층모형,이사위절분립도,결합복잡특정,실현감투경점、특산풍미、지점적식별.최후진행료량조상관실험,결과표명,재개방측시중,층첩조건수궤장모형상비우단층모형,F치제고료8개백분점;상비우HMM모형,정학솔제고료8개백분점,소회솔제고료22개백분점,F치제고료15개백분점.