基因表达谱数据挖掘是生物信息学领域的重要研究内容之一,发展高效实用的基因表达谱数据处理技术有助于挖掘重要的肿瘤基因信息,对肿瘤的早期发现、临床诊断与治疗以及疾病预防具有非常重要的科学意义和实际价值。粒计算是当前人工智能领域中模拟人类思维和解决复杂问题的新理论与新方法,它涵盖了所有有关粒度的理论、方法和技术,是研究大规模复杂问题求解、大数据分析与挖掘、不确定性信息处理的有力工具。由此,如何高效地从大规模复杂高维的基因表达谱数据中迅速挖掘数据之间的潜在关系,已成为粒计算研究知识获取技术的关键问题。《基因表达谱数据挖掘的粒计算方法与应用》介绍了基因表达谱数据挖掘的粒计算方法与应用的*新进展,内容涉及基因表达谱数据挖掘的相关技术、粒计算的相关理论、基于邻域熵的肿瘤基因选择方法、基于邻域互信息的肿瘤基因选择方法、基于监督学习和粒计算的肿瘤基因选择方法。
更多科学出版社服务,请扫码获取。
目录
前言
第1章 基因表达谱数据挖掘的相关技术 1
1.1 引言 1
1.2 基因表达谱数据 3
1.2.1 基因表达谱数据的表示 3
1.2.2 基因表达谱数据的特点 4
1.2.3 基因表达谱数据的数学描述 5
1.3 特征选择 6
1.3.1 基因表达谱数据的特征选择 6
1.3.2 基于过滤法的特征选择 7
1.3.3 基于封装法的特征选择 8
1.3.4 基于嵌入法的特征选择 8
1.3.5 搜索策略 9
1.4 评价标准与指标 10
1.5 小结 12
参考文献 12
第2章 粒计算的相关理论 18
2.1 粒计算的基本概念 18
2.2 粗糙集理论 20
2.3 模糊集理论 30
2.4 邻域粗糙集 37
2.5 粗糙模糊集 39
2.6 多粒度粗糙集 43
2.7 信息熵度量 47
2.8 邻域熵度量 70
2.9 小结 73
参考文献 74
第3章 基于邻域熵的肿瘤基因选择方法 82
3.1 基于邻域熵不确定性度量的肿瘤基因选择方法 82
3.1.1 引言 82
3.1.2 可信度与覆盖度 82
3.1.3 基于决策邻域熵的不确定性度量 84
3.1.4 启发式非单调特征选择模型 86
3.1.5 基于决策邻域熵的肿瘤基因选择算法 89
3.1.6 实验结果与分析 91
3.1.7 小结 104
3.2 基于邻域近似决策熵的肿瘤基因数据的特征选择方法 104
3.2.1 引言 104
3.2.2 邻域近似精度 105
3.2.3 邻域近似决策熵 106
3.2.4 基于邻域近似决策熵的特征选择算法 108
3.2.5 算法计算复杂度分析 109
3.2.6 实验结果与分析 109
3.2.7 小结 116
3.3 基于Lebesgue测度和邻域熵的邻域粗糙集特征选择方法 116
3.3.1 引言 116
3.3.2 基于Lebesgue测度的不确定性度量 117
3.3.3 基于邻域熵的不确定性度量 117
3.3.4 基于邻域粗糙联合熵的特征选择 119
3.3.5 特征选择算法 119
3.3.6 实验结果与分析 121
3.3.7 小结 127
3.4 基于Lebesgue测度和熵度量的不完备邻域系统特征选择方法 127
3.4.1 引言 127
3.4.2 不完备邻域决策系统的Lebesgue测度 128
3.4.3 基于邻域容差熵的不确定性度量 129
3.4.4 基于邻域容差依赖联合熵的特征选择 130
3.4.5 不完备邻域决策系统特征选择算法 131
3.4.6 实验结果与分析 132
3.4.7 小结 139
3.5 基于Lebesgue测度和熵度量的邻域多粒度粗糙集特征选择方法 140
3.5.1 引言 140
3.5.2 邻域多粒度粗糙集 140
3.5.3 邻域多粒度粗糙集中基于Lebesgue测度的不确定性度量 142
3.5.4 基于邻域多粒度熵的不确定性度量 143
3.5.5 基于悲观邻域多粒度依赖联合熵的特征选择算法 144
3.5.6 实验结果与分析 146
3.5.7 小结 152
3.6 基于模糊邻域条件熵的基因选择方法 152
3.6.1 引言 152
3.6.2 模糊邻域关系 153
3.6.3 模糊邻域粒和模糊决策 154
3.6.4 模糊邻域条件熵 157
3.6.5 基于模糊邻域条件熵的基因选择算法 159
3.6.6 实验结果与分析 160
3.6.7 小结 163
参考文献 163
第4章 基于邻域互信息的肿瘤基因选择方法 171
4.1 基于邻域互信息和粒子群优化的肿瘤基因选择方法 171
4.1.1 引言 171
4.1.2 粒子群优化 171
4.1.3 邻域互信息 172
4.1.4 基于邻域互信息的Relief算法 173
4.1.5 基于邻域粗糙集和粒子群优化的基因选择算法 174
4.1.6 实验结果与分析 175
4.1.7 小结 177
4.2 基于邻域互信息和自组织映射的基因选择方法 177
4.2.1 引言 177
4.2.2 自组织映射 178
4.2.3 获胜神经元 179
4.2.4 特征重要性系数 179
4.2.5 基于邻域互信息和自组织映射的基因选择算法 179
4.2.6 实验结果与分析 180
4.2.7 小结 181
4.3 基于邻域互信息和模糊C均值聚类的基因选择方法 181
4.3.1 引言 181
4.3.2 模糊C均值聚类 182
4.3.3 基于邻域互信息的特征内聚度和特征间的邻域耦合度 183
4.3.4 FCM聚类中心初始化算法 184
4.3.5 基于邻域互信息和模糊C均值聚类的基因选择算法 184
4.3.6 实验结果与分析 185
4.3.7 小结 187
4.4 基于邻域条件互信息的肿瘤基因选择方法 188
4.4.1 引言 188
4.4.2 邻域条件互信息 188
4.4.3 基于邻域互信息的基因选择 189
4.4.4 基于邻域条件互信息的基因选择 189
4.4.5 实验结果与分析 190
4.4.6 小结 191
参考文献 191
第5章 基于监督学习和粒计算的肿瘤基因选择方法 196
5.1 基于Fisher线性判别和邻域依赖度的基因选择方法 196
5.1.1 引言 196
5.1.2 Fisher线性判别 197
5.1.3 邻域依赖度 198
5.1.4 基于FLD和邻域依赖度的肿瘤基因选择算法 198
5.1.5 实验结果与分析 200
5.1.6 小结 202
5.2 基于信噪比与邻域粗糙集的基因选择方法 202
5.2.1 引言 202
5.2.2 信噪比 203
5.2.3 信噪比值区间划分 204
5.2.4 基于信噪比与邻域粗糙集的基因选择算法 204
5.2.5 实验结果与分析 206
5.2.6 小结 208
5.3 基于统计特性的邻域粗糙集肿瘤基因选择方法 208
5.3.1 引言 208
5.3.2 信息基因重要度 209
5.3.3 基因相关性度量函数 210
5.3.4 基于统计特性的邻域粗糙集肿瘤基因选择算法 213
5.3.5 实验结果与分析 215
5.3.6 小结 216
5.4 基于信息增益与邻域粗糙集的基因选择方法 216
5.4.1 引言 216
5.4.2 斯皮尔曼秩相关系数 217
5.4.3 信息增益 217
5.4.4 肿瘤基因数据预处理 218
5.4.5 基于信息增益和邻域粗糙集的肿瘤基因选择算法 218
5.4.6 实验结果与分析 219
5.4.7 小结 221
5.5 基于PCA和多邻域粗糙集的肿瘤基因选择方法 222
5.5.1 引言 222
5.5.2 主成分分析 222
5.5.3 主成分分析预处理 223
5.5.4 多邻域粗糙集 223
5.5.5 基于主成分分析和多邻域粗糙集的肿瘤基因选择算法 224
5.5.6 实验结果与分析 226
5.5.7 小结 227
5.6 基于logistic与相关信息熵的基因选择方法 228
5.6.1 引言 228
5.6.2 logistic回归模型与信息熵 229
5.6.3 二项logistic回归模型 229
5.6.4 相关信息熵 230
5.6.5 基于logistic和相关信息熵的基因选择算法 230
5.6.6 实验结果与分析 232
5.6.7 小结 233
参考文献 233