合肥工业大学学报(自然科学版)
閤肥工業大學學報(自然科學版)
합비공업대학학보(자연과학판)
JOURNAL OF HEFEI UNIVERSITY OF TECHNOLOGY
2010年
2期
188-192,207
,共6页
信息检索%可跟踪性链%程序理解%逆向工程
信息檢索%可跟蹤性鏈%程序理解%逆嚮工程
신식검색%가근종성련%정서리해%역향공정
information retrieval(IR)%traceability link%program comprehension%reverse engineering
文章提出了一种提取中文软件文档与源代码间的关联关系的方法,根据中文软件文档和源代码的一些特征,在潜在语义索引模型的基础上使用了3种策略:引入项目数据词典辅助中文分词和中英文的翻译、将文档按类型分层以实现反馈,调整代码中的特征项的权值.实验结果表明,同时使用3种策略可以在提取阀值C相同的情况下,提高查全率4%~28%,在查全率不变的情况下,提高查准率8%~30%.
文章提齣瞭一種提取中文軟件文檔與源代碼間的關聯關繫的方法,根據中文軟件文檔和源代碼的一些特徵,在潛在語義索引模型的基礎上使用瞭3種策略:引入項目數據詞典輔助中文分詞和中英文的翻譯、將文檔按類型分層以實現反饋,調整代碼中的特徵項的權值.實驗結果錶明,同時使用3種策略可以在提取閥值C相同的情況下,提高查全率4%~28%,在查全率不變的情況下,提高查準率8%~30%.
문장제출료일충제취중문연건문당여원대마간적관련관계적방법,근거중문연건문당화원대마적일사특정,재잠재어의색인모형적기출상사용료3충책략:인입항목수거사전보조중문분사화중영문적번역、장문당안류형분층이실현반궤,조정대마중적특정항적권치.실험결과표명,동시사용3충책략가이재제취벌치C상동적정황하,제고사전솔4%~28%,재사전솔불변적정황하,제고사준솔8%~30%.
In this paper,a retrieval method for traceability links between source code and Chinese docu-mentation is proposed,according to several features of Chinese software documents and source code.Based on the latent semantic indexing model,three strategies are used to improve:hierarchical en-hancement,identifiers classifying,and data dictionary.Experimental results show that all the three strategies could increase the recall by 4% to 28% under the same extracted threshold and the precision by 8% to 30% under the same recall.