计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2015年
4期
1021-1025,1044
,共6页
软件工程%历史沿革%信息抽取%关键词抽取%TextRank
軟件工程%歷史沿革%信息抽取%關鍵詞抽取%TextRank
연건공정%역사연혁%신식추취%관건사추취%TextRank
software engineering%history evolution%information extraction%keyword extraction%TextRank
针对在软件工程的教学过程中,由于领域概念种类多、演变快,导致学生理解记忆困难的问题,提出了通过抽取软件工程领域历史沿革主题信息构建知识库的方法.该方法首先结合自然语言处理技术与Web信息抽取技术从维基百科的自由文本中抽取实体与实体关系构建候选集;再利用关键词抽取方法TextRank从候选集中抽取与历史沿革关系最密切的实体关系;最后以关键实体关系为核心,抽取邻近的时间实体与概念实体组成五元组构建了知识库.在抽取信息的过程中,结合文本的语义信息对TextRank算法进行了改进,提高了抽取的准确率.实验结果表明,该知识库能够将软件工程领域的概念按时序特征组织在一起,验证了所提方法的有效性.
針對在軟件工程的教學過程中,由于領域概唸種類多、縯變快,導緻學生理解記憶睏難的問題,提齣瞭通過抽取軟件工程領域歷史沿革主題信息構建知識庫的方法.該方法首先結閤自然語言處理技術與Web信息抽取技術從維基百科的自由文本中抽取實體與實體關繫構建候選集;再利用關鍵詞抽取方法TextRank從候選集中抽取與歷史沿革關繫最密切的實體關繫;最後以關鍵實體關繫為覈心,抽取鄰近的時間實體與概唸實體組成五元組構建瞭知識庫.在抽取信息的過程中,結閤文本的語義信息對TextRank算法進行瞭改進,提高瞭抽取的準確率.實驗結果錶明,該知識庫能夠將軟件工程領域的概唸按時序特徵組織在一起,驗證瞭所提方法的有效性.
침대재연건공정적교학과정중,유우영역개념충류다、연변쾌,도치학생리해기억곤난적문제,제출료통과추취연건공정영역역사연혁주제신식구건지식고적방법.해방법수선결합자연어언처리기술여Web신식추취기술종유기백과적자유문본중추취실체여실체관계구건후선집;재이용관건사추취방법TextRank종후선집중추취여역사연혁관계최밀절적실체관계;최후이관건실체관계위핵심,추취린근적시간실체여개념실체조성오원조구건료지식고.재추취신식적과정중,결합문본적어의신식대TextRank산법진행료개진,제고료추취적준학솔.실험결과표명,해지식고능구장연건공정영역적개념안시서특정조직재일기,험증료소제방법적유효성.