本书共六章内容,具体安排如下。
第1章,描述了数据科学的基础概念和发展历程,对数据科学的定义、方法、工具、语言和框架做了的总体介绍。此外,第1章从教育、医疗、交通、农业、营销、用户行为特征等方面展开说明数据科学对现实生活的影响,以及从海量数据的有效性与数据共享问题揭示数据科学目前面临的机遇与挑战。
第2章,阐述了数据科学的基础知识,首先介绍了数据科学知识体系的构成,然后分别从数据获取、数据存储、数据处理这三个角度对数据科学技术架构的演化进行了探索,最后对数据科学技术的七个领域分别做出简单的介绍。
第3章,介绍了数据科学技术方法。该章首先介绍了数据科学技术方法概论和数据统计分析方法。然后详细介绍了分类技术,包括基于最近邻的分类、贝叶斯分类、神经网络分类、组合分类方法、多分类问题和分类技术应用案例。最后介绍了聚类技术,包括聚类分析、相似性度量方法、常见聚类分析方法、聚类评估和聚类技术应用。
第4章,对数据科学的一些常见应用场景进行了介绍,包括数据科学在个性化推荐、智慧医疗、电子商务和专利分析领域的应用。针对不同的应用场景,本书以案例为线索,对应用场景的相关概念、发展现状、面临的挑战和具体方法进行了介绍。
第5章,主要介绍了数据智能驱动的创新与创业。首先介绍了数据所蕴含的商业价值以及在数据挖掘过程中的难点及应对,然后阐述了数据驱动下的创新创业的内涵、现状与机会,并对应用案例进行讨论,最后归纳了数据驱动下的技术创新模式与管理要素。
第6章,主要介绍了数据安全与伦理问题,通过列举一些典型案例引发读者的思考,讨论了数据安全与隐私保护的对策建议和数据伦理问题的治理方案。
我们生活在互联网与信息技术无处不在的时代,人们的生活离不开各类智能设备,由于人们的创作内容与使用轨迹被各类应用所记录,用户数据量迅猛增长。与此同时,产业数据的标准化与存储设备也不断发展,产业数据也飞速增长,大量的数据带来了巨大的挑战,而这些挑战又带来了前所未有的创新能力和经济机遇,数据已逐步成了推动各类应用创新、产业转型、商业模式变革的原动力。
牛奔,男,博士(后),教授,深圳大学博导,目前担任深圳大学管理科学系系主任、深圳大学创新创业教育中心副主任、大湾区国际创新学院创新创业研究中心主任。长期从事管理、经济、创新创业、计算机、生物、人工智能等多学科交叉领域的科研工作,发表相关学术论文100余篇,其中SCI/SSCI论文45篇、EI收录88篇,出版著作5部。近五年来,获得多项荣誉,如入选教育部工业工程专业 “教指委委员”,国家 “香江学者”,广东省高等学校“千百十人才”“广东省珠江学者”“广东省优秀青年教师”,深圳市“高层次专业人才” “海外高层次人才孔雀计划”,深圳大学首届“荔园优青”、深圳大学“优秀学者”、深圳大学“交叉创新团队”负责人。近年来主持国家自然科学基金项目的6项,广东省教育厅重点项目1项、中国博士后科学基金项目的2项。耿爽,女,博士,系深圳大学管理学院管理科学系助理教授,硕士生导师,2018年获得香港城市大学系统工程与工程管理专业哲学博士学位,英国巴斯大学访问学者,入选深圳高层次海外人才计划。研究方向包括:管理信息系统、智能决策系统、数字化媒体用户行为、教育科技创新等,在SSCI/SCI/CSSCI检索国际期刊发表十余篇论文,主持及参与国家自然科学基金两项、完成中国博士后基金项目一项,曾担任国际服务系统与服务管理(ICSSSM’19)学术会议分会主席。王红,女,博士,系深圳大学管理学院管理科学系助理教授,硕士生导师,2017年获得香港理工大学工程学院博士学位。研究方向包括:优化与决策、人工智能、特征选择、数据挖掘、特征提取等。在SSCI/SCI/CSSCI检索国际期刊发表十余篇论文,主持及参与国家自然科学基金两项。曾获得国际群体智能大会论文优秀论文奖,中国管理科学学术年会论文最佳论文奖。
目录
第1章数据科学的概念与影响
1.1数据的基础概念
1.1.1什么是数据
1.1.2数据结构模式
1.1.3数据的价值
1.2数据科学发展历程
1.3什么是数据科学
1.3.1数据科学的概念
1.3.2数据科学使用的方法
1.3.3数据科学使用的工具
1.3.4数据科学使用的语言
1.3.5数据科学使用的架构
1.4数据科学的影响
1.4.1变革教育模式
1.4.2提升医疗服务水平
1.4.3构建智慧交通
1.4.4发展农业建设
1.4.5提升营销价值
1.4.6反馈群体行为特征
1.5数据科学面临的机遇与挑战
1.5.1海量却无效的数据
1.5.2数据共享问题
1.6本章小结
参考文献
第2章数据科学基础
2.1数据科学技术的整体概览
2.1.1数据科学技术的介绍
2.1.2数据科学技术架构的演进
2.2各个技术分支的简介
2.2.1数据采集
2.2.2数据传输
2.2.3数据存储
2.2.4数据处理
2.2.5数据应用
2.2.6基础技术
2.2.7数据治理
2.3本章小结
参考文献
第3章数据科学技术方法
3.1数据科学技术方法概论
3.1.1数据分析及挖掘技术整体概论
3.1.2数据统计分析方法介绍
3.1.3基于机器学习的数据科学技术方法
3.1.4模型评估与选择
3.2数据统计分析
3.2.1数据分布特征的度量
3.2.2参数估计
3.2.3假设检验
3.2.4方差分析
3.2.5回归分析
3.3分类技术
3.3.1分类技术的基本概念
3.3.2基于最近邻的分类
3.3.3人工神经网络
3.3.4支持向量机
3.3.5组合分类方法
3.4聚类分析
3.4.1聚类分析的定义
3.4.2相似性度量方法
3.4.3划分方法
3.4.4层次方法
3.4.5基于密度的方法
3.4.6聚类评估
3.4.7聚类技术应用案例
3.5本章小结
参考文献
第4章数据科学的应用
4.1推荐算法
4.1.1推荐算法的发展与现状
4.1.2推荐算法的应用
4.1.3推荐系统的核心步骤与常用特征
4.1.4协同过滤
4.1.5基于内容的推荐
4.1.6基于模型的推荐
4.1.7混合推荐
4.1.8推荐算法的应用案例
4.2数据科学与智慧医疗
4.2.1基本概念
4.2.2发展现状
4.2.3当前挑战
4.2.4应用场景
4.2.5典型案例
4.3数据科学与电子商务
4.3.1电子商务发展现状思考
4.3.2电子商务数据分析
4.3.3案例介绍
4.4数据科学与专利分析
4.4.1专利分析概念
4.4.2数据趋势分析
4.4.3数据构成分析
4.4.4数据排序分析
4.4.5数据关联分析
4.5本章小结
参考文献
第5章数据智能创新与创业
5.1数据背后的商业价值挖掘
5.1.1数据的商业价值
5.1.2数据价值挖掘难点及应对
5.2数据驱动下的创新创业
5.2.1数据驱动下的创新创业的内涵与特征
5.2.2数据驱动下的创新创业现状
5.2.3数据驱动下的创新创业机会
5.2.4案例分析:数据驱动下的智能养猪
5.3数据驱动下的技术创新
5.3.1数据驱动下的技术创新的内涵与类型
5.3.2数据驱动下的企业商业模式的技术创新
5.3.3数据驱动下的企业技术创新的管理要素
5.3.4案例分析:数据驱动生鲜农产品供应链模式创新
5.4本章小结
参考文献
第6章数据安全与伦理
6.1数据安全和隐私保护
6.1.1数据安全和隐私保护的问题
6.1.2典型案例
6.1.3数据时代的数据安全与隐私保护
6.2数据伦理
6.2.1数据伦理的概念
6.2.2数据伦理问题
6.2.3典型案例
6.3数据伦理的管理策略建议
6.4本章小结
参考文献
后记
推荐图书1
推荐图书2
推荐图书3