商务智能与数据挖掘是近年来企业信息化的热点研究内容。本书共分为9章,包括商务智能概述、商务智能中的核心技术、数据挖掘概述、分类分析、关联分析、聚类分析、深度学习、Web挖掘技术、数据挖掘在电子商务中的应用等内容,它汇集了统计学、机器学习、数据库、人工智能等学科,具有多学科交叉以及技术与管理融合等特点。
本书内容全面,案例丰富,适合作为计算机应用、软件工程、信息管理、电子商务和管理科学等相关专业的本科生和研究生教材,也可作为企事业单位、政府部门、研究机构等从事商务智能理论研究工作的相关人员的参考资料。
《商务智能与数据挖掘(第2版)》介绍了商务智能的基本概念、产生与发展、主要研究内容、主流商务智能产品以及商务智能的未来发展趋势,使读者对商务智能有一个概要的认识;论述了数据仓库和在线分析处理、数据可视化和数据挖掘等核心技术;详细介绍了数据挖掘的具体方法,即分类分析、关联分析、聚类分析和深度学习。在此基础上,讨论了商务智能与数据挖掘在Web数据挖掘和电子商务领域中的应用。
目录
第1章商务智能概述
1.1商务智能的概念
1.1.1数据、信息与知识
1.1.2商务智能的定义
1.1.3商务智能的特点
1.1.4商务智能的过程
1.2商务智能的产生与发展
1.2.1商务智能的产生和发展过程
1.2.2商务智能与其他系统的关系
1.3商务智能的研究内容
1.4商务智能系统的支撑技术
1.5商务智能系统框架及数据流程
1.5.1商务智能系统框架
1.5.2商务智能系统的数据流程
1.6主流商务智能产品
1.6.1主流商务智能产品简介
1.6.2商务智能的抉择
1.7商务智能的未来发展趋势
1.8商务智能的应用
小结
习题
第2章商务智能中的核心技术
2.1数据仓库
2.1.1数据仓库的产生与发展
2.1.2数据仓库的概念与特征
2.1.3ETL
2.1.4数据集市
2.1.5数据仓库的数据组织
2.1.6数据仓库的体系结构
2.1.7数据仓库的开发步骤
2.2在线分析处理
2.2.1OLAP简介
2.2.2OLAP的定义和相关概念
2.2.3OLAP与OLTP的区别
2.2.4OLAP的分类
2.2.5OLAP多维数据分析
2.3数据可视化
2.3.1什么是数据可视化
2.3.2数据可视化的优势
2.3.3数据可视化工具
小结
习题
第3章数据挖掘概述
3.1数据挖掘的起源与发展
3.1.1数据挖掘的起源
3.1.2数据挖掘的发展
3.2数据挖掘所要解决的问题
3.3数据挖掘的定义
3.4数据挖掘的过程
3.5数据挖掘系统
3.5.1数据挖掘系统的分类
3.5.2数据挖掘系统的发展
3.6数据挖掘的功能和方法
3.6.1数据挖掘的功能
3.6.2数据挖掘的方法
3.7数据挖掘的典型应用领域
3.8数据挖掘的发展趋势
小结
习题
第4章分类分析
4.1预备知识
4.2解决分类问题的一般方法
4.3分类算法
4.3.1贝叶斯分类器
4.3.2贝叶斯信念网络
4.3.3决策树
4.3.4支持向量机
4.3.5粗糙集
4.3.6其他分类算法
4.4评估分类器的性能
4.4.1保持方法
4.4.2随机二次抽样
4.4.3交叉验证
4.4.4自助法
小结
习题
第5章关联分析
5.1引言
5.2基本概念
5.3关联规则的种类
5.4关联规则的研究现状
5.5关联规则挖掘算法
5.5.1Apriori算法
5.5.2Apriori改进算法
5.5.3FP增长算法
5.6改善关联规则挖掘质量问题
5.6.1用户主观层面
5.6.2系统客观层面
5.7约束数据挖掘问题
小结
习题
第6章聚类分析
6.1聚类的概念
6.1.1聚类概念及应用
6.1.2聚类算法要求
6.1.3聚类技术类型划分
6.2聚类分析的统计量
6.2.1模型定义
6.2.2相似性度量
6.3常用聚类算法
6.3.1k均值算法
6.3.2kmedoids算法
6.3.3凝聚层次聚类算法
6.3.4DBSCAN算法
6.3.5STING算法
6.3.6CLIQUE算法
6.4簇评估
6.4.1概述
6.4.2非监督簇评估:使用凝聚度和分离度
6.4.3非监督簇评估:使用邻近度矩阵
6.4.4层次聚类的非监督评估
6.4.5确定正确的簇个数
6.4.6聚类趋势
6.4.7簇有效性的监督度量
6.5聚类与分类比较
小结
习题
第7章深度学习
7.1深度学习的由来
7.1.1深度学习的神经学启示
7.1.2浅层结构函数表示能力的局限性
7.1.3特征提取的需要
7.2深度学习的经典方法
7.2.1深度学习表示模型和网络结构
7.2.2自动编码器
7.2.3受限玻尔兹曼机
7.2.4卷积神经网络
7.3深度学习的应用
7.3.1深度学习在语音识别、合成及机器翻译中的应用
7.3.2深度学习在图像分类及识别中的应用
7.3.3深度学习在视频分类及行为识别中的应用
7.4深度学习的研究近况及未来研究方向
7.4.1研究近况
7.4.2未来研究方向
小结
习题
第8章Web挖掘技术
8.1Web数据挖掘概述
8.1.1Web数据挖掘的概念
8.1.2Web数据挖掘的特点
8.1.3Web数据挖掘的处理流程
8.1.4Web数据挖掘与信息检索、信息抽取的区别
8.2Web数据挖掘分类
8.2.1Web内容挖掘概述
8.2.2Web结构挖掘概述
8.2.3Web使用挖掘概述
8.3Web内容挖掘
8.3.1特征提取和特征表示
8.3.2自动摘要
8.3.3文本分类
8.3.4文本聚类
8.4Web结构挖掘
8.4.1超链和页面内容的关系
8.4.2不同挖掘阶段的分析
8.4.3PageRank
8.4.4HITS
8.4.5两种算法的比较
8.4.6Web结构挖掘应用
8.5Web使用挖掘
8.5.1Web使用挖掘数据预处理
8.5.2Web使用挖掘模式发现
8.5.3Web使用挖掘模式分析
8.5.4Web使用挖掘模式应用
小结
习题
第9章数据挖掘在电子商务中的应用
9.1网站结构优化
9.2智能搜索引擎
9.2.1网络机器人
9.2.2文本分析
9.2.3搜索条件的获取和分析
9.2.4信息的搜索和排序
9.3移动商务智能
9.4客户关系管理
9.4.1营销
9.4.2销售
9.4.3客户服务
9.4.4客户保持
9.4.5风险评估和欺诈识别
9.5客户分类
9.5.1传统的客户分类理论
9.5.2基于客户行为的客户分类
9.5.3基于客户生命周期的客户分类
9.5.4基于客户生命周期价值的客户分类
小结
习题
参考文献
第5章关联分析“数据海量,信息缺乏”是很多行业在数据爆炸过程中普遍面对的尴尬,如今对信息的获取能力,决定了在前所未有的激烈竞争环境中的决策能力。如何挖掘出数据中存在的各种有用的信息,即对这些数据进行分析,发现其数据模式及特征,然后可能发现某个客户、消费群体或组织的金融和商业兴趣,并可以观察金融市场的变化趋势,有效地获取信息,是每个人、每个组织的难题。信息是现代企业的生命线,如果一个“结点”既不提供信息也不使用信息,也就失去了存在的价值。关联分析(Association Analysis)用于发现隐藏在大型数据集中的令人感兴趣的关联关系,描述数据之间的密切度。5.1引言
引例1——购物篮分析1993年美国学者Rakesh Agrawa发表的一篇论文,即Mining Association Rules between Sets of Items in Large Databases,是目前关于关联分析方面被引用最多的一篇文献,提出通过分析购物篮中的商品集合,从而找出商品之间关联关系的关联算法,并根据商品之间的关系,找出客户的购买行为。世界著名商业零售企业沃尔玛拥有世界上最大的数据仓库系统,集中了其各门店原始的详细交易数据,为了能够准确地了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行了购物篮分析。想知道顾客经常一起购买的商品有哪些,数据挖掘技术的先锋NCR Teradata公司帮助沃尔玛创造了这一传奇。NCR利用数据挖掘工具对这些数据进行分析和挖掘,意外发现“跟尿布一起被购买最多的商品竟是啤酒”。这是沃尔玛最为经典的商品陈列故事,该规则表明尿布和啤酒的销售之间存在着很强的联系,因为许多购买尿布的顾客也购买啤酒。既然尿布与啤酒在一起被购买的机会会增多,于是沃尔玛就在其一个个门店里,将尿布和啤酒赫然摆在一起出售,并且这个奇特的举措使两者的销售都大为增加。
引例2——网页挖掘
当人们浏览网页的时候,经常看到不少页面: “浏览本页面的网友还喜欢”“我们猜测你还喜欢以下页面”等这样的功能。网站通过收集每个用户的历史浏览数据,可以得出浏览过当前页面的所有用户以及这些用户浏览了哪些其他页面,然后将这些页面合并,就得出了一个同时被浏览页面列表的排序,然后根据一定的策略,排除一些页面,保留一些高关联性的页面。上述案例的关联规则就是: “购买某类商品的顾客,还会同时购买何种商品”“浏览过该页面的用户,还浏览过哪些页面”。这中间最重要的两个步骤,就是“找到关联内容和去除低关联内容”,而判断关联程度高低的最常用的度量分别是支持度(Support)和置信度(Confidence)。关联规则可以发现交易数据库中不同商品之间的联系,这些规则找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响。发现这样的规则可以应用于指导商家科学地安排进货、管理库存、布置货架、制定营销策略以及根据购买模式对用户进行分类。关联规则可以发现大型事务或关系型数据库中项之间有趣的联系。随着大量数据不断地收集和存储,许多业界人士对于从数据库中挖掘这种模式越来越感兴趣。从大量商务事务记录中发现有趣的相关联系,可以帮助分析顾客的购买行为模式,从而帮助许多商务决策制定,如分类设计、交叉销售、营销规划和顾客购买习惯分析。