计算机与数字工程
計算機與數字工程
계산궤여수자공정
COMPUTER & DIGITAL ENGINEERING
2010年
11期
69-71,85
,共4页
HotData%ETL%生物医学%附加数据
HotData%ETL%生物醫學%附加數據
HotData%ETL%생물의학%부가수거
学术期刊中的附加数据是进行数据分析和文本挖掘的重要依据,具有的分散性、多样性和时效性的特点,难以管理和维护,文章将这类数据称HotData.HotDataSpider以生物医学类文献为研究对象,对生物信息学领域15本国际权威期刊提供的附加数据进行分析,实现了自动抽取、转换,最终将整理好的数据集批量导入到上海生物信息技术研究中心提供的HotData主题数据库中.
學術期刊中的附加數據是進行數據分析和文本挖掘的重要依據,具有的分散性、多樣性和時效性的特點,難以管理和維護,文章將這類數據稱HotData.HotDataSpider以生物醫學類文獻為研究對象,對生物信息學領域15本國際權威期刊提供的附加數據進行分析,實現瞭自動抽取、轉換,最終將整理好的數據集批量導入到上海生物信息技術研究中心提供的HotData主題數據庫中.
학술기간중적부가수거시진행수거분석화문본알굴적중요의거,구유적분산성、다양성화시효성적특점,난이관리화유호,문장장저류수거칭HotData.HotDataSpider이생물의학류문헌위연구대상,대생물신식학영역15본국제권위기간제공적부가수거진행분석,실현료자동추취、전환,최종장정리호적수거집비량도입도상해생물신식기술연구중심제공적HotData주제수거고중.