蛋白质结合位点的识别对深入理解蛋白质的生物学功能具有重要的意义。本书致力于从描述特征、残基定义和数据筛选三个方面进行优化,从而构建蛋白质结合位点预测的有效方法,主要内容包括基于氨基酸组成偏好的配体结合口袋识别方法、使用随机森林方法进行蛋白质结合位点的预测和基于数据聚类的蛋白质结合位点识别,并在此基础上介绍了相关的辅助分子对接应用研究。
本书可作为生物信息学及计算机辅助药物设计等相关专业研究生、教师和科研人员的参考用书。
第1章绪论001
1.1引言001
1.2蛋白质结构与功能004
1.2.1一级结构004
1.2.2二级结构006
1.2.3三级结构006
1.2.4四级结构007
1.2.5蛋白质稳定性008
1.2.6蛋白质结构分析008
1.2.7蛋白质结构稳定性分析009
1.2.8蛋白质功能009
1.3配体-受体相互作用原理010
1.3.1受体-配体结合的关键点010
1.3.2结合过程理论模型010
1.3.3配体-受体相互作用的物理学性质013
1.4蛋白质结合位点预测研究现状018
1.4.1蛋白质-蛋白质和蛋白质-配体结合位点的比较019
1.4.2蛋白质-配体结合位点预测020
1.4.3蛋白质-蛋白质结合位点预测029
1.5本研究的主要工作033
1.5.1基于氨基酸组成偏好的配体结合口袋识别方法034
1.5.2使用随机森林方法进行蛋白质结合位点的预测034
1.5.3残基聚类方法及其对蛋白质结合位点预测的应用035
1.5.4蛋白质结合位点预测辅助分子对接035
第2章基于氨基酸组成偏好的配体结合口袋识别方法037
2.1引言037
2.2基于全局口袋氨基酸组成偏好的配体结合口袋识别方法038
2.2.1材料与方法038
2.2.2结果与讨论046
2.3基于局部口袋氨基酸组成偏好的配体结合口袋识别方法051
2.3.1材料与方法051
2.3.2结果与讨论053
2.4本章小结057
第3章使用随机森林方法进行蛋白质结合位点的预测058
3.1引言058
3.1.1单棵树生长方法058
3.1.2自助法重采样059
3.1.3随机森林算法059
3.2基于单块残基属性定义模型的蛋白质-配体结合位点预测061
3.2.1材料与方法061
3.2.2结果与讨论066
3.3基于多块残基属性定义模型的蛋白质-蛋白质结合位点预测068
3.3.1材料与方法068
3.3.2结果与讨论073
3.4本章小结079
第4章基于数据聚类的蛋白质结合位点识别081
4.1引言081
4.2简单迭代方法优化蛋白质-配体结合位点识别085
4.2.1随机森林086
4.2.2验证方法086
4.2.3残差表示模型087
4.2.4阈值调整方法087
4.2.5迭代法087
4.2.6实验结果与分析088
4.3基于最小协方差行列式(MCD)和马氏距离的蛋白质-蛋白质结合位点识别091
4.3.1数据集093
4.3.2残基模型和评价指标093
4.3.3MCD计算、马氏距离和鲁棒距离094
4.3.4随机森林095
4.3.5交叉验证和独立测试096
4.3.6实验结果与分析096
4.4基于随机森林邻近距离的蛋白质-蛋白质结合位点识别101
4.4.1数据集103
4.4.2残基模型103
4.4.3随机森林104
4.4.4距离度量104
4.4.5数据过滤与评价105
4.4.6邻近距离优化106
4.4.7实验结果与分析107
4.5本章小结113
第5章蛋白质结合位点预测及辅助分子对接115
5.1引言115
5.1.1分子对接方法分类116
5.1.2目前面临的主要问题116
5.2结合位点预测信息前端使用辅助蛋白质-配体对接117
5.2.1材料与方法117
5.2.2结果与讨论120
5.3结合位点预测信息后端使用辅助蛋白质-蛋白质对接122
5.3.1材料与方法123
5.3.2结果与讨论128
5.4本章小结135
第6章总结与展望136
6.1研究工作总结136
6.2未来研究展望138
参考文献140