现代电子技术
現代電子技術
현대전자기술
MODERN ELECTRONICS TECHNIQUE
2013年
24期
5-7
,共3页
提取%撒拉%词频%引用度
提取%撒拉%詞頻%引用度
제취%살랍%사빈%인용도
extraction%Sarah%degree of word frequency%citation rate
在文献管理和研究中经常会做关键词提取的工作,通过人工的方式进行提取过程繁杂,工程量极大,因此引入一种关键词欲提取的方式,其过程主要采用以下三个步骤:先通过OCR系统对图片进行识别、排错;再通过词频技术,来提取词频及关联性最高的关键词,将其作为备选关键词;然后通过人为阅读的方式,按照一定的关键词人工提取规则进行关键词的精确提取。结果表明,该方法取得了较好的效果。
在文獻管理和研究中經常會做關鍵詞提取的工作,通過人工的方式進行提取過程繁雜,工程量極大,因此引入一種關鍵詞欲提取的方式,其過程主要採用以下三箇步驟:先通過OCR繫統對圖片進行識彆、排錯;再通過詞頻技術,來提取詞頻及關聯性最高的關鍵詞,將其作為備選關鍵詞;然後通過人為閱讀的方式,按照一定的關鍵詞人工提取規則進行關鍵詞的精確提取。結果錶明,該方法取得瞭較好的效果。
재문헌관리화연구중경상회주관건사제취적공작,통과인공적방식진행제취과정번잡,공정량겁대,인차인입일충관건사욕제취적방식,기과정주요채용이하삼개보취:선통과OCR계통대도편진행식별、배착;재통과사빈기술,래제취사빈급관련성최고적관건사,장기작위비선관건사;연후통과인위열독적방식,안조일정적관건사인공제취규칙진행관건사적정학제취。결과표명,해방법취득료교호적효과。
The keyword extraction work is often done in the literature management. The artificial extraction may cause a complex process,and the work burden is heavy. A method of keyword pre-extraction is introduced,which is mainly divided into three steps:the image recognition and troubleshooting are conducted first by OCR system;the word frequency technology is used to extract the word frequency and highest relevance keywords as alternative keywords;and then through man-made reading manner,the accurate extraction of keywords is achieved in accordance with a certain keyword manual extraction rule.