中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2012年
2期
51-55,61
,共6页
王荀%李素建%宋涛%姜伯平
王荀%李素建%宋濤%薑伯平
왕순%리소건%송도%강백평
FrameNet语料库%内容侧面发现%框架识别
FrameNet語料庫%內容側麵髮現%框架識彆
FrameNet어료고%내용측면발현%광가식별
文本内容通常包含多个侧面,全面地识别这些内容侧面对自然语言处理有重要地意义.传统的统计方法使用简单特征难以识别出所有的内容侧面.以自动摘要为例,传统的抽取式方法多以词频为主要特征,一些重要的句子常因重复度不高被舍弃.要想全面地覆盖原始文本的重要信息,就要识别出文本描述的内容侧面.该文以框架语义学为指导,使用FrameNet语料库作为知识库,综合多种特征来标注文本描述的框架,在此基础上识别文本所包含的内容侧面.该方法在新闻语料上取得了较好地结果,达到了61%的正确率.
文本內容通常包含多箇側麵,全麵地識彆這些內容側麵對自然語言處理有重要地意義.傳統的統計方法使用簡單特徵難以識彆齣所有的內容側麵.以自動摘要為例,傳統的抽取式方法多以詞頻為主要特徵,一些重要的句子常因重複度不高被捨棄.要想全麵地覆蓋原始文本的重要信息,就要識彆齣文本描述的內容側麵.該文以框架語義學為指導,使用FrameNet語料庫作為知識庫,綜閤多種特徵來標註文本描述的框架,在此基礎上識彆文本所包含的內容側麵.該方法在新聞語料上取得瞭較好地結果,達到瞭61%的正確率.
문본내용통상포함다개측면,전면지식별저사내용측면대자연어언처리유중요지의의.전통적통계방법사용간단특정난이식별출소유적내용측면.이자동적요위례,전통적추취식방법다이사빈위주요특정,일사중요적구자상인중복도불고피사기.요상전면지복개원시문본적중요신식,취요식별출문본묘술적내용측면.해문이광가어의학위지도,사용FrameNet어료고작위지식고,종합다충특정래표주문본묘술적광가,재차기출상식별문본소포함적내용측면.해방법재신문어료상취득료교호지결과,체도료61%적정학솔.