中国图书馆学报
中國圖書館學報
중국도서관학보
The Journal of The Library Science in China
2014年
2期
107~119
,共null页
数值信息 数值知识元 数值信息抽取 命名实体识别
數值信息 數值知識元 數值信息抽取 命名實體識彆
수치신식 수치지식원 수치신식추취 명명실체식별
Numerical information. Numeric knowledge element. Numerical information extraction. Named entityrecognition.
通过对数值信息抽取文献的调研,先从文献类型、学科领域、高频关键词三个方面进行定量分析,从抽取数据源、抽取对象、抽取方法与技术、结果评价和应用等方面对当前数值信息抽取研究进行了梳理和总结.研究发现当前对于数值信息抽取的研究具有五个特点:抽取数据源以新闻语料、Web网页为主,抽取对象以基数类数值信息和数量类数值信息为主,抽取方法以基于规则的方法为主,抽取结果评价指标比较单一,但应用领域较为广泛.图4.表3.参考文献56.
通過對數值信息抽取文獻的調研,先從文獻類型、學科領域、高頻關鍵詞三箇方麵進行定量分析,從抽取數據源、抽取對象、抽取方法與技術、結果評價和應用等方麵對噹前數值信息抽取研究進行瞭梳理和總結.研究髮現噹前對于數值信息抽取的研究具有五箇特點:抽取數據源以新聞語料、Web網頁為主,抽取對象以基數類數值信息和數量類數值信息為主,抽取方法以基于規則的方法為主,抽取結果評價指標比較單一,但應用領域較為廣汎.圖4.錶3.參攷文獻56.
통과대수치신식추취문헌적조연,선종문헌류형、학과영역、고빈관건사삼개방면진행정량분석,종추취수거원、추취대상、추취방법여기술、결과평개화응용등방면대당전수치신식추취연구진행료소리화총결.연구발현당전대우수치신식추취적연구구유오개특점:추취수거원이신문어료、Web망혈위주,추취대상이기수류수치신식화수량류수치신식위주,추취방법이기우규칙적방법위주,추취결과평개지표비교단일,단응용영역교위엄범.도4.표3.삼고문헌56.
This paper first makes a quantitative analysis on the documents of numerical information extraction from three as- pects: document type, subject area and high frequency keywords. Then the research context is summarized from four aspects: data source type, object for extraction, extraction method and technique, result evaluation and corresponding application. Our findings are as follows: news corpus and web pages are the main data sources; cardinal numbers and quantitative phrases are the main objects for extraction; extraction method and technique are mainly rule-based and the result evaluation indicators are rela- tively simple but have a wide scope for application. 4 figs. 3 tabs. 56 refs.