计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
23期
139-142,150
,共5页
数据集成%对象识别%上下文环境
數據集成%對象識彆%上下文環境
수거집성%대상식별%상하문배경
对象识别是数据集成的一个重要问题,针对学术领域的对象集成问题,提出一个基于上下文环境的对象识别模型.利用作者名字的上下文环境,包括合作者、国际会议、论文时间、论文标题4维信息对作者进行对象识别.通过计算两个表象每一维信息的相似程度,采用感知器模型对于少量的专家标注的学习用例进行学习从而获得每一维合适的权重以及对应的阈值,最后利用构造的模型进行准确预测.实验结果表明该模型具有较高的可用性.
對象識彆是數據集成的一箇重要問題,針對學術領域的對象集成問題,提齣一箇基于上下文環境的對象識彆模型.利用作者名字的上下文環境,包括閤作者、國際會議、論文時間、論文標題4維信息對作者進行對象識彆.通過計算兩箇錶象每一維信息的相似程度,採用感知器模型對于少量的專傢標註的學習用例進行學習從而穫得每一維閤適的權重以及對應的閾值,最後利用構造的模型進行準確預測.實驗結果錶明該模型具有較高的可用性.
대상식별시수거집성적일개중요문제,침대학술영역적대상집성문제,제출일개기우상하문배경적대상식별모형.이용작자명자적상하문배경,포괄합작자、국제회의、논문시간、논문표제4유신식대작자진행대상식별.통과계산량개표상매일유신식적상사정도,채용감지기모형대우소량적전가표주적학습용례진행학습종이획득매일유합괄적권중이급대응적역치,최후이용구조적모형진행준학예측.실험결과표명해모형구유교고적가용성.