青岛大学学报(自然科学版)
青島大學學報(自然科學版)
청도대학학보(자연과학판)
JOURNAL OF QINGDAO UNIVERSITY(NATURAL SCIENCE EDITION)
2014年
2期
23-28
,共6页
关联规则%垂直数据结构%多线程并行%Apriori算法%匹配度
關聯規則%垂直數據結構%多線程併行%Apriori算法%匹配度
관련규칙%수직수거결구%다선정병행%Apriori산법%필배도
association rule%vertical data format%multi-thread parallel computing%Apriori%match degree
疾病表型通常会受SNP位点调控,挖掘疾病表型与SNP位点间的关联规则有助于提供个性化分子诊疗方案.由于SNP位点具有遗传异质性,在挖掘疾病表型与SNP位点间的关联规则时,需要将最小支持度阈值设为较低值,甚至是0,又由于SNP位点数据量庞大,这会使得关联规则算法时间复杂度极高.为此,提出了HEMAPS算法,通过使用线程并行处理和垂直数据格式改进Apriori算法.此外,为解决质量性状表型样本比例不平衡问题,提出了一种新的关联规则评价指标——匹配度.实验结果表明,HEMAPS算法的时间复杂度比Apriori算法明显降低.
疾病錶型通常會受SNP位點調控,挖掘疾病錶型與SNP位點間的關聯規則有助于提供箇性化分子診療方案.由于SNP位點具有遺傳異質性,在挖掘疾病錶型與SNP位點間的關聯規則時,需要將最小支持度閾值設為較低值,甚至是0,又由于SNP位點數據量龐大,這會使得關聯規則算法時間複雜度極高.為此,提齣瞭HEMAPS算法,通過使用線程併行處理和垂直數據格式改進Apriori算法.此外,為解決質量性狀錶型樣本比例不平衡問題,提齣瞭一種新的關聯規則評價指標——匹配度.實驗結果錶明,HEMAPS算法的時間複雜度比Apriori算法明顯降低.
질병표형통상회수SNP위점조공,알굴질병표형여SNP위점간적관련규칙유조우제공개성화분자진료방안.유우SNP위점구유유전이질성,재알굴질병표형여SNP위점간적관련규칙시,수요장최소지지도역치설위교저치,심지시0,우유우SNP위점수거량방대,저회사득관련규칙산법시간복잡도겁고.위차,제출료HEMAPS산법,통과사용선정병행처리화수직수거격식개진Apriori산법.차외,위해결질량성상표형양본비례불평형문제,제출료일충신적관련규칙평개지표——필배도.실험결과표명,HEMAPS산법적시간복잡도비Apriori산법명현강저.