遗传
遺傳
유전
HEREDITAS(BEIJING)
2011年
8期
820-828
,共9页
复杂疾病%基因-基因相互作用%GPU%性状%易感位点
複雜疾病%基因-基因相互作用%GPU%性狀%易感位點
복잡질병%기인-기인상호작용%GPU%성상%역감위점
复杂疾病目前正在全球范围流行,极大地影响人类的健康.研究发现,复杂疾病的性状受到多个位点的相互作用影响.目前的全基因组关联分析(Genome-wide association study,GWAS)仅仅解析单个SNP位点对疾病易感性的贡献,单纯依靠这一种策略并不能在寻找复杂疾病的病因上得到根本性的突破.基因-基因相互作用可能是复杂疾病致病的主要因素之一.针对这一点,科学家已经提出了一些检验基因相互作用的算法,包括惩罚logistic回归模型、多因子降维(Multifactor dimensional reduction)、集合关联法(Set-association approach)、贝叶斯网络(Bayesian networks)、随机森林法等.文章首先对目前这些方法做了综述,并指出了其中的不足,包括计算复杂度太高、假设驱动、数据会过度拟合、对低维数据不敏感等,进而简述了一种由笔者所在实验室开发的基于GPU的研究基因相互作用的算法,该算法复杂度低,不需要任何假设,没有边际效应,有很好的稳定性,速度快,适用于进行全基因组范围内的基因-基因相互作用计算.
複雜疾病目前正在全毬範圍流行,極大地影響人類的健康.研究髮現,複雜疾病的性狀受到多箇位點的相互作用影響.目前的全基因組關聯分析(Genome-wide association study,GWAS)僅僅解析單箇SNP位點對疾病易感性的貢獻,單純依靠這一種策略併不能在尋找複雜疾病的病因上得到根本性的突破.基因-基因相互作用可能是複雜疾病緻病的主要因素之一.針對這一點,科學傢已經提齣瞭一些檢驗基因相互作用的算法,包括懲罰logistic迴歸模型、多因子降維(Multifactor dimensional reduction)、集閤關聯法(Set-association approach)、貝葉斯網絡(Bayesian networks)、隨機森林法等.文章首先對目前這些方法做瞭綜述,併指齣瞭其中的不足,包括計算複雜度太高、假設驅動、數據會過度擬閤、對低維數據不敏感等,進而簡述瞭一種由筆者所在實驗室開髮的基于GPU的研究基因相互作用的算法,該算法複雜度低,不需要任何假設,沒有邊際效應,有很好的穩定性,速度快,適用于進行全基因組範圍內的基因-基因相互作用計算.
복잡질병목전정재전구범위류행,겁대지영향인류적건강.연구발현,복잡질병적성상수도다개위점적상호작용영향.목전적전기인조관련분석(Genome-wide association study,GWAS)부부해석단개SNP위점대질병역감성적공헌,단순의고저일충책략병불능재심조복잡질병적병인상득도근본성적돌파.기인-기인상호작용가능시복잡질병치병적주요인소지일.침대저일점,과학가이경제출료일사검험기인상호작용적산법,포괄징벌logistic회귀모형、다인자강유(Multifactor dimensional reduction)、집합관련법(Set-association approach)、패협사망락(Bayesian networks)、수궤삼림법등.문장수선대목전저사방법주료종술,병지출료기중적불족,포괄계산복잡도태고、가설구동、수거회과도의합、대저유수거불민감등,진이간술료일충유필자소재실험실개발적기우GPU적연구기인상호작용적산법,해산법복잡도저,불수요임하가설,몰유변제효응,유흔호적은정성,속도쾌,괄용우진행전기인조범위내적기인-기인상호작용계산.