小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2011年
1期
17-23
,共7页
翁彧%胡长军%席强%张学春
翁彧%鬍長軍%席彊%張學春
옹욱%호장군%석강%장학춘
e-science环境%特征发现%多领域数据模型%Web文本挖掘
e-science環境%特徵髮現%多領域數據模型%Web文本挖掘
e-science배경%특정발현%다영역수거모형%Web문본알굴
传统领域信息抽取方法多依赖领域词典实现文本特征的发现,既不便于实验复现,也不易于其在多领域环境中移植与推广,严重制约了模型的应用范围.针对上述不足,提出一种适用于e-Science环境的多领域Web文本特征抽取模型(简称e-WTDE).该模型将无词典分词技术引入多领域文本特征发现过程,摆脱了对于领域词典的依赖;借助对领域主题及其具体事件中共性与个性特征的抽取与分类,模型动态追踪领域事件发生及其发展变化,并最终形成多个区域性数据中心;通过对各数据中心中领域知识的协同调度,有力提高了领域信息在全局范围内的利用效率.验证实验中分别对多领域特征抽取、主题特征动态追踪以及领域知识协同调度予以有效性验证,并进一步证明了模型的实用效果.
傳統領域信息抽取方法多依賴領域詞典實現文本特徵的髮現,既不便于實驗複現,也不易于其在多領域環境中移植與推廣,嚴重製約瞭模型的應用範圍.針對上述不足,提齣一種適用于e-Science環境的多領域Web文本特徵抽取模型(簡稱e-WTDE).該模型將無詞典分詞技術引入多領域文本特徵髮現過程,襬脫瞭對于領域詞典的依賴;藉助對領域主題及其具體事件中共性與箇性特徵的抽取與分類,模型動態追蹤領域事件髮生及其髮展變化,併最終形成多箇區域性數據中心;通過對各數據中心中領域知識的協同調度,有力提高瞭領域信息在全跼範圍內的利用效率.驗證實驗中分彆對多領域特徵抽取、主題特徵動態追蹤以及領域知識協同調度予以有效性驗證,併進一步證明瞭模型的實用效果.
전통영역신식추취방법다의뢰영역사전실현문본특정적발현,기불편우실험복현,야불역우기재다영역배경중이식여추엄,엄중제약료모형적응용범위.침대상술불족,제출일충괄용우e-Science배경적다영역Web문본특정추취모형(간칭e-WTDE).해모형장무사전분사기술인입다영역문본특정발현과정,파탈료대우영역사전적의뢰;차조대영역주제급기구체사건중공성여개성특정적추취여분류,모형동태추종영역사건발생급기발전변화,병최종형성다개구역성수거중심;통과대각수거중심중영역지식적협동조도,유력제고료영역신식재전국범위내적이용효솔.험증실험중분별대다영역특정추취、주제특정동태추종이급영역지식협동조도여이유효성험증,병진일보증명료모형적실용효과.