复旦学报(医学版)
複旦學報(醫學版)
복단학보(의학판)
FUDAN UNIVERSITY JOURNAL OF MEDICAL SCIENCES
2011年
3期
265-270
,共6页
候选基因关联研究%病例对照设计%交互作用%数据挖掘
候選基因關聯研究%病例對照設計%交互作用%數據挖掘
후선기인관련연구%병례대조설계%교호작용%수거알굴
候选基因关联研究中基因-基因、基因-环境交互作用的统计分析有利于揭示疾病的发生机制.本文针对病例对照设计的候选基因关联研究,综述交互作用的统计方法及其进展.交互作用的统计方法包括参数法和非参数法.参数法中最常用的为Logistic回归模型,非参数法主要是数据挖掘方法.有4类数据挖掘方法可用于候选基因关联研究,包括降维法、基于树的方法、模式识别法和贝叶斯法.本文对最常用且可靠的几种数据挖掘方法(多因子降维法、分类回归树、随机森林、贝叶斯上位效应关联图谱)的原理、分析过程和优缺点予以比较.参数法和非参数法分析交互作用时各有优缺点;低维数据的分析可采用参数法和非参数法,高维数据的分析则主要采用非参数法.随着基因分型技术的发展,可检测的SNP规模逐渐增大,使得非参数方法的应用越来越广.
候選基因關聯研究中基因-基因、基因-環境交互作用的統計分析有利于揭示疾病的髮生機製.本文針對病例對照設計的候選基因關聯研究,綜述交互作用的統計方法及其進展.交互作用的統計方法包括參數法和非參數法.參數法中最常用的為Logistic迴歸模型,非參數法主要是數據挖掘方法.有4類數據挖掘方法可用于候選基因關聯研究,包括降維法、基于樹的方法、模式識彆法和貝葉斯法.本文對最常用且可靠的幾種數據挖掘方法(多因子降維法、分類迴歸樹、隨機森林、貝葉斯上位效應關聯圖譜)的原理、分析過程和優缺點予以比較.參數法和非參數法分析交互作用時各有優缺點;低維數據的分析可採用參數法和非參數法,高維數據的分析則主要採用非參數法.隨著基因分型技術的髮展,可檢測的SNP規模逐漸增大,使得非參數方法的應用越來越廣.
후선기인관련연구중기인-기인、기인-배경교호작용적통계분석유리우게시질병적발생궤제.본문침대병례대조설계적후선기인관련연구,종술교호작용적통계방법급기진전.교호작용적통계방법포괄삼수법화비삼수법.삼수법중최상용적위Logistic회귀모형,비삼수법주요시수거알굴방법.유4류수거알굴방법가용우후선기인관련연구,포괄강유법、기우수적방법、모식식별법화패협사법.본문대최상용차가고적궤충수거알굴방법(다인자강유법、분류회귀수、수궤삼림、패협사상위효응관련도보)적원리、분석과정화우결점여이비교.삼수법화비삼수법분석교호작용시각유우결점;저유수거적분석가채용삼수법화비삼수법,고유수거적분석칙주요채용비삼수법.수착기인분형기술적발전,가검측적SNP규모축점증대,사득비삼수방법적응용월래월엄.