本书针对分类属性数据无监督数据挖掘任务中的三个关键问题—特征学习、分析过程和结果评价,阐述分类属性数据深度无监督学习理论及决策应用。全书共7章,第1章概述数据驱动决策支持的技术基础、有监督学习和无监督学习两类数据挖掘方法及分类属性数据无监督学习问题;第2章介绍分类属性数据的无监督特征学习、聚类分析和聚类结果评价等相关理论与方法;第3章系统阐述深度无监督特征学习、深度聚类和网络嵌入方法;第4~6章针对分类属性数据提供了包含深度无监督特征学习、深度聚类和聚类内部有效性评价的一整套深度无监督学习解决方案;第7章以人才招聘为实际问题背景,演绎了分类属性数据深度无监督学习方法在决策支持中的应用。
更多科学出版社服务,请扫码获取。
信息资源的科学分类与调查,国家信息中心优秀研究成果一等奖,2013年,排名第1。
目录
前言
第1章 决策支持与无监督学习 1
1.1 数据驱动的决策支持 1
1.1.1 数据库知识发现与数据挖掘 1
1.1.2 数据挖掘的主要任务 1
1.1.3 数据驱动的决策支持过程 3
1.1.4 决策支持中的数据特征 4
1.2 决策支持中的数据挖掘方法 7
1.2.1 有监督学习 7
1.2.2 无监督学习 8
1.3 分类属性数据无监督学习问题 9
1.3.1 研究与应用难点 9
1.3.2 深度学习提供的新思路 10
1.3.3 分类属性数据深度无监督学习体系 11
1.4 本章小结 11
第2章 无监督学习基础及其分类属性数据研究 13
2.1 无监督学习基础 13
2.1.1 无监督特征学习 13
2.1.2 无监督分析过程 14
2.1.3 无监督结果评价 27
2.1.4 分类属性数据无监督学习过程 29
2.2 分类属性数据无监督特征学习 30
2.2.1 传统编码 30
2.2.2 相似度矩阵 31
2.2.3 嵌入表征 32
2.3 分类属性数据聚类 33
2.3.1 分割聚类 33
2.3.2 层次聚类 36
2.3.3 聚类方法分析 36
2.4 分类属性数据聚类结果评价 37
2.4.1 内部有效性评价 38
2.4.2 评价有效性的验证 40
2.5 本章小结 41
第3章 深度无监督学习 43
3.1 深度无监督特征学习 43
3.1.1 重构模型 43
3.1.2 生成模型 48
3.1.3 自监督学习模型 53
3.2 深度聚类 55
3.2.1 深度聚类概述 55
3.2.2 自动编码器深度聚类 55
3.2.3 神经网络聚类损失深度聚类 57
3.2.4 变分自动编码器深度聚类 60
3.2.5 生成式对抗网络深度聚类 61
3.3 网络嵌入 62
3.3.1 网络拓扑结构嵌入 62
3.3.2 网络辅助信息嵌入 65
3.3.3 网络外部信息嵌入 66
3.4 本章小结 66
第4章 分类属性数据深度无监督特征学习 68
4.1 决策支持中的深度无监督特征学习需求 68
4.2 分类属性数据深度无监督特征学习问题 70
4.2.1 问题特征及内涵 70
4.2.2 分类属性间关系和分类属性内关系定义 70
4.2.3 网络嵌入深度无监督特征学习思路 72
4.3 加权异构网络构建 74
4.3.1 分类属性间关系的网络构建 74
4.3.2 分类属性内关系的网络构建 74
4.4 网络嵌入深度无监督特征学习 77
4.4.1 分类属性取值的深度特征学习 77
4.4.2 分类属性数据的特征学习 83
4.4.3 深度无监督特征学习的优势分析 84
4.5 实验分析 85
4.5.1 实验数据集及设计 85
4.5.2 准确性分析 87
4.5.3 深度特征对聚类效果的提升分析 93
4.5.4 参数敏感性分析 96
4.6 本章小结 97
第5章 分类属性数据深度聚类 99
5.1 决策支持中的深度聚类需求 99
5.2 分类属性数据深度聚类问题 100
5.2.1 问题特征及内涵 100
5.2.2 网络嵌入深度聚类思路 101
5.3 网络嵌入深度聚类 102
5.3.1 加权异构网络中的对齐编码 103
5.3.2 聚类损失及类中心初始化 106
5.3.3 深度聚类过程 109
5.3.4 深度聚类的优势分析 112
5.4 实验分析 113
5.4.1 实验数据集及设计 113
5.4.2 引入聚类损失对聚类效果的提升分析 115
5.4.3 深度聚类结果准确性分析 122
5.4.4 特征学习结果分析 125
5.4.5 参数敏感性分析 127
5.5 本章小结 128
第6章 分类属性数据聚类内部有效性评价 130
6.1 决策支持中的聚类内部有效性评价需求 130
6.2 分类属性数据聚类内部有效性评价问题 131
6.2.1 问题特征及内涵 131
6.2.2 常用指标特征分析 132
6.3 内部有效性评价指标 140
6.3.1 基本思想 140
6.3.2 距离度量 141
6.3.3 指标构建 145
6.3.4 特征分析 147
6.4 实验分析 147
6.4.1 实验数据集及设计 148
6.4.2 准确性分析 149
6.4.3 适用性分析 155
6.4.4 参数敏感性分析 158
6.5 本章小结 159
第7章 分类属性数据深度无监督学习的应用实例 160
7.1 人才招聘中的深度无监督学习需求 160
7.2 人才招聘数据准备 161
7.2.1 数据来源 162
7.2.2 数据属性及预处理 162
7.2.3 人才数据基本特征分析 163
7.3 人才数据深度无监督特征学习 166
7.3.1 学习过程 166
7.3.2 学习结果分析 168
7.4 人才数据深度聚类及内部有效性评价 170
7.4.1 深度聚类过程 171
7.4.2 内部有效性评价 172
7.5 基于人才数据聚类结果的人才招聘决策支持 173
7.5.1 不同类型人才的特征 173
7.5.2 支持人才招聘的决策建议 182
7.6 本章小结 185
参考文献 186
索引 197
后记 204