高等学校化学学报
高等學校化學學報
고등학교화학학보
CHEMICAL JOURNAL OF CHINESE UNIVERSITIES
2007年
10期
1885-1888
,共4页
磷糖蛋白%随机森林%模式识别
燐糖蛋白%隨機森林%模式識彆
린당단백%수궤삼림%모식식별
应用随机森林方法、开放源代码软件-CDK(Chemistry Development Kit)描述符与170个化合物的训练数据集[其中96个为磷糖蛋白(P-gp)底物],建立了P-gp底物的识别模型.研究了CDK描述符与P-gp底物识别的关系,结果表明,原子极化性和电荷偏面积等分子属性对P-gp底物识别起到重要作用.该模型对训练集的预测正确率为99.42%;对外部测试集(42个化合物,其中24个为P-gp底物)的预测结果为P-gp底物、非底物及总测试集的识别正确率分别为87.50%,83.33%和85.71%.212个化合物数据集上的Leave-One-Out交叉验证识别正确率为77.4%.
應用隨機森林方法、開放源代碼軟件-CDK(Chemistry Development Kit)描述符與170箇化閤物的訓練數據集[其中96箇為燐糖蛋白(P-gp)底物],建立瞭P-gp底物的識彆模型.研究瞭CDK描述符與P-gp底物識彆的關繫,結果錶明,原子極化性和電荷偏麵積等分子屬性對P-gp底物識彆起到重要作用.該模型對訓練集的預測正確率為99.42%;對外部測試集(42箇化閤物,其中24箇為P-gp底物)的預測結果為P-gp底物、非底物及總測試集的識彆正確率分彆為87.50%,83.33%和85.71%.212箇化閤物數據集上的Leave-One-Out交扠驗證識彆正確率為77.4%.
응용수궤삼림방법、개방원대마연건-CDK(Chemistry Development Kit)묘술부여170개화합물적훈련수거집[기중96개위린당단백(P-gp)저물],건립료P-gp저물적식별모형.연구료CDK묘술부여P-gp저물식별적관계,결과표명,원자겁화성화전하편면적등분자속성대P-gp저물식별기도중요작용.해모형대훈련집적예측정학솔위99.42%;대외부측시집(42개화합물,기중24개위P-gp저물)적예측결과위P-gp저물、비저물급총측시집적식별정학솔분별위87.50%,83.33%화85.71%.212개화합물수거집상적Leave-One-Out교차험증식별정학솔위77.4%.