计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2012年
8期
41-45,61
,共6页
命名实体%自动获取%维基百科%隶属度
命名實體%自動穫取%維基百科%隸屬度
명명실체%자동획취%유기백과%대속도
利用维基百科(Wikipedia)和已有命名实体资源,提出维基百科类的隶属度计算方法,通过匹配、计算、过滤、扩展、去噪五个步骤构建出具有较高质量和较大规模的命名实体实例集.在英语维基百科数据上进行实验,结果显示,基于隶属度方法自动获取的人名实例规模较DBpedia抽取出的人名实例规模高出近10倍,通过对不同隶属度区间的抽取实例进行人工检验,发现抽取出的前15000个维基百科类的准确率达到99%左右,能够有效支持命名实体类实例的扩充.
利用維基百科(Wikipedia)和已有命名實體資源,提齣維基百科類的隸屬度計算方法,通過匹配、計算、過濾、擴展、去譟五箇步驟構建齣具有較高質量和較大規模的命名實體實例集.在英語維基百科數據上進行實驗,結果顯示,基于隸屬度方法自動穫取的人名實例規模較DBpedia抽取齣的人名實例規模高齣近10倍,通過對不同隸屬度區間的抽取實例進行人工檢驗,髮現抽取齣的前15000箇維基百科類的準確率達到99%左右,能夠有效支持命名實體類實例的擴充.
이용유기백과(Wikipedia)화이유명명실체자원,제출유기백과류적대속도계산방법,통과필배、계산、과려、확전、거조오개보취구건출구유교고질량화교대규모적명명실체실례집.재영어유기백과수거상진행실험,결과현시,기우대속도방법자동획취적인명실례규모교DBpedia추취출적인명실례규모고출근10배,통과대불동대속도구간적추취실례진행인공검험,발현추취출적전15000개유기백과류적준학솔체도99%좌우,능구유효지지명명실체류실례적확충.