计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2004年
2期
229-232
,共4页
PDF%基于规则%信息提取%插件
PDF%基于規則%信息提取%插件
PDF%기우규칙%신식제취%삽건
电子文档的信息提取是建立数字图书馆的基础.论文主要介绍一个数字图书馆的信息采集子系统.它以PDF文件为提取对象,由全自动化录入和半自动录入两部分构成.全自动录入融合了基于规则和自动机两种提取方法的优点,具有速度快、准确率高等特点;半自动录入采用在Adobe Acrobat内部加入plug-in(插件)的方法为用户提供友好的使用界面,使用户可以方便地进行手工录入.
電子文檔的信息提取是建立數字圖書館的基礎.論文主要介紹一箇數字圖書館的信息採集子繫統.它以PDF文件為提取對象,由全自動化錄入和半自動錄入兩部分構成.全自動錄入融閤瞭基于規則和自動機兩種提取方法的優點,具有速度快、準確率高等特點;半自動錄入採用在Adobe Acrobat內部加入plug-in(插件)的方法為用戶提供友好的使用界麵,使用戶可以方便地進行手工錄入.
전자문당적신식제취시건립수자도서관적기출.논문주요개소일개수자도서관적신식채집자계통.타이PDF문건위제취대상,유전자동화록입화반자동록입량부분구성.전자동록입융합료기우규칙화자동궤량충제취방법적우점,구유속도쾌、준학솔고등특점;반자동록입채용재Adobe Acrobat내부가입plug-in(삽건)적방법위용호제공우호적사용계면,사용호가이방편지진행수공록입.