关于我们
书单推荐
新书推荐
|
|
本书主要探讨数据挖掘中的项集挖掘问题,详细介绍了频繁项集、高可用项集、最大频繁项集、频繁闭项集的定义、挖掘算法、搜索空间剪枝技术、性能优化等方面的内容。
-
前言
第1章 概述
1.1 项集:数据挖掘研究领域的焦点之一
1.2 频繁项集挖掘问题的研究历史
1.3 高可用项集挖掘问题的研究历史
1.4 本书的主要内容
第2章 频繁项集挖掘问题
2.1 概述
2.1.1 问题形式化定义
2.1.2 搜索空间与方法
2.2 基础频繁项集挖掘算法介绍
2.2.1 经典的候选生成Apriori算法
2.2.2 以垂直视角处理数据库的Eclat算法
2.2.3 基于前缀树结构的FPgrowth算法
2.3 性能测试的软硬件环境
2.3.1 数据库描述
2.3.2 参照算法介绍
2.3.3 其他软硬件设施
2.4 实验一:三种基础算法的性能测试
2.4.1 实验结果
2.4.2 性能评价
第3章 BFP-growth:快速模式增长算法
3.1 经典模式增长算法的性能分析
3.1.1 影响FP-growth性能的三个因素
3.1.2 ICDM*佳算法:FPgrowth
3.2 批量模式增长算法:BFP-growth
3.2.1 性能提升的途径
3.2.2 核心步骤:两次前缀树遍历
3.2.3 算法伪代码
3.3 BFP-growth算法的性能分析
3.3.1 *少的遍历花费
3.3.2 FP-array技术应该集成在BFP-growth中吗
3.3.3 无修饰的前缀树结构
3.4 实验二:BFP-growth的性能测试及讨论
3.4.1 BFP-growth及FPgrowth*与基础算法的对比
3.4.2 实验结果讨论
3.5 小结
第4章 基于结点集合结构的NS算法
4.1 Eclat及FPgrowth算法的优缺点
4.2 结点集合结构(Nodeset)
4.2.1 条件结点
4.2.2 结点拓扑序号
4.2.3 使用结点集合结构表示前缀树
4.3 NS算法
4.3.1 映射前缀树到结点集合结构
4.3.2 从结点集合结构中挖掘频繁项集
4.3.3 一个例子
4.3.4 NS算法的原子操作
4.4 实验三:NS算法与其他快速挖掘算法的性能对比
4.4.1 实验结果
|