现代计算机(专业版)
現代計算機(專業版)
현대계산궤(전업판)
MODERN COMPUTER
2010年
4期
132-135,142
,共5页
信息抽取%Word抽取%文档分割
信息抽取%Word抽取%文檔分割
신식추취%Word추취%문당분할
从系统构思、表头信息抽取、表格信息抽取几个方面详细介绍一个Word信息抽取系统的原理和实现方法;在表格信息处理部分,分为必修改课和选修课两种情况,并就内存可能溢出的情况给出相应的处理方法.实验结果显示,该系统能够从附录所示格式的文档中正确地抽取出相应的数据.
從繫統構思、錶頭信息抽取、錶格信息抽取幾箇方麵詳細介紹一箇Word信息抽取繫統的原理和實現方法;在錶格信息處理部分,分為必脩改課和選脩課兩種情況,併就內存可能溢齣的情況給齣相應的處理方法.實驗結果顯示,該繫統能夠從附錄所示格式的文檔中正確地抽取齣相應的數據.
종계통구사、표두신식추취、표격신식추취궤개방면상세개소일개Word신식추취계통적원리화실현방법;재표격신식처리부분,분위필수개과화선수과량충정황,병취내존가능일출적정황급출상응적처리방법.실험결과현시,해계통능구종부록소시격식적문당중정학지추취출상응적수거.