中国生物医学工程学报
中國生物醫學工程學報
중국생물의학공정학보
CHINESE JOURNAL OF BIOMEDICAL ENGINEERING
2013年
1期
14-20
,共7页
杨合龙%祝磊%韩斌%厉力华%郑智国%孟旭莉
楊閤龍%祝磊%韓斌%厲力華%鄭智國%孟旭莉
양합룡%축뢰%한빈%려력화%정지국%맹욱리
蛋白质质谱%近邻传播聚类分析%特征选择%生物标志物
蛋白質質譜%近鄰傳播聚類分析%特徵選擇%生物標誌物
단백질질보%근린전파취류분석%특정선택%생물표지물
针对如何有效分析高通量SELDI-TOF质谱数据以及筛选与肿瘤相关的蛋白质位点,提出一种基于近邻传播聚类分析的特征选择方法.首先利用t-test对SELDI数据进行初筛,然后利用近邻传播聚类分析以及零空间LDA对数据进行降维和去相关处理,最后采用SVM-RFE进行特征选择,筛选出与肿瘤判别相关的蛋白质位点.利用SVM、KNN、NB及J4.8等4个分类器,估算算法的分类性能.结果表明,在卵巢癌公共数据集OC-WCX2a和OC-WCX2b以及浙江省肿瘤医院乳腺癌数据集BC-WCX2a上显示该算法,在上述3个数据集中分类率分别达到96.43%、99.66%、90.88%,敏感性分别达到97.00%、100%、96.17%,特异性分别达到95.85%、99.08%、81.92%,并分别挑选出与肿瘤判别相关的10个蛋白位点.所提出的算法能够获得较好的分类率,有效提取出具有较好判别效果的蛋白质谱位点,有助于癌症的辅助诊断.
針對如何有效分析高通量SELDI-TOF質譜數據以及篩選與腫瘤相關的蛋白質位點,提齣一種基于近鄰傳播聚類分析的特徵選擇方法.首先利用t-test對SELDI數據進行初篩,然後利用近鄰傳播聚類分析以及零空間LDA對數據進行降維和去相關處理,最後採用SVM-RFE進行特徵選擇,篩選齣與腫瘤判彆相關的蛋白質位點.利用SVM、KNN、NB及J4.8等4箇分類器,估算算法的分類性能.結果錶明,在卵巢癌公共數據集OC-WCX2a和OC-WCX2b以及浙江省腫瘤醫院乳腺癌數據集BC-WCX2a上顯示該算法,在上述3箇數據集中分類率分彆達到96.43%、99.66%、90.88%,敏感性分彆達到97.00%、100%、96.17%,特異性分彆達到95.85%、99.08%、81.92%,併分彆挑選齣與腫瘤判彆相關的10箇蛋白位點.所提齣的算法能夠穫得較好的分類率,有效提取齣具有較好判彆效果的蛋白質譜位點,有助于癌癥的輔助診斷.
침대여하유효분석고통량SELDI-TOF질보수거이급사선여종류상관적단백질위점,제출일충기우근린전파취류분석적특정선택방법.수선이용t-test대SELDI수거진행초사,연후이용근린전파취류분석이급령공간LDA대수거진행강유화거상관처리,최후채용SVM-RFE진행특정선택,사선출여종류판별상관적단백질위점.이용SVM、KNN、NB급J4.8등4개분류기,고산산법적분류성능.결과표명,재란소암공공수거집OC-WCX2a화OC-WCX2b이급절강성종류의원유선암수거집BC-WCX2a상현시해산법,재상술3개수거집중분류솔분별체도96.43%、99.66%、90.88%,민감성분별체도97.00%、100%、96.17%,특이성분별체도95.85%、99.08%、81.92%,병분별도선출여종류판별상관적10개단백위점.소제출적산법능구획득교호적분류솔,유효제취출구유교호판별효과적단백질보위점,유조우암증적보조진단.