情报学报
情報學報
정보학보
Journal of the China Society for Scientific andTechnical Information
2015年
4期
388-397
,共10页
条件随机场%CRFs%段落划分%要素识别%特征模板
條件隨機場%CRFs%段落劃分%要素識彆%特徵模闆
조건수궤장%CRFs%단락화분%요소식별%특정모판
conditional random fields%CRFs%paragraphs segmentation%elements recognition%feature template
本文为科研论文的结构化处理提供了一种有价值的方法。本文采用条件随机场模型,综合原始语料中科研论文的局部与整体特征,使用复杂特征模板对段落进行自动划分以及对构成要素进行自动识别。在开放测试中,F 值最高分别达88%和92%。同时本文对CRFs和 ME在段落自动划分与构成要素识别实验中进行了比较分析,认为CRFs在付出更大的时间复杂度的代价下,其处理效果明显优于ME。
本文為科研論文的結構化處理提供瞭一種有價值的方法。本文採用條件隨機場模型,綜閤原始語料中科研論文的跼部與整體特徵,使用複雜特徵模闆對段落進行自動劃分以及對構成要素進行自動識彆。在開放測試中,F 值最高分彆達88%和92%。同時本文對CRFs和 ME在段落自動劃分與構成要素識彆實驗中進行瞭比較分析,認為CRFs在付齣更大的時間複雜度的代價下,其處理效果明顯優于ME。
본문위과연논문적결구화처리제공료일충유개치적방법。본문채용조건수궤장모형,종합원시어료중과연논문적국부여정체특정,사용복잡특정모판대단락진행자동화분이급대구성요소진행자동식별。재개방측시중,F 치최고분별체88%화92%。동시본문대CRFs화 ME재단락자동화분여구성요소식별실험중진행료비교분석,인위CRFs재부출경대적시간복잡도적대개하,기처리효과명현우우ME。
The article provides avaluable method for the academic papers’ structuration process. It summaries original academic papers,local and global features and uses the complex feature template to the task of paragraphs segmentation and elements recognition based on CRFs. In open tests,the best F value can reach 88% and 92% respectively. Based on the comparison between CRFs and ME,the article gains the conclusion that the effect of CRFs is more excelent than ME but costs more time.