本书帮你掌握通过机器学习和深度学习来识别和解决复杂问题所需的基本技能。本书使用了流行的 Python机器学习生态系统中的真实示例,将成为你在学习机器学习的艺术和科学并成为一名成功的从业者道路上的完美伴侣。本书中使用的概念、技术、工具、框架和方法将教会你如何成功思考、设计、构建和执行机器学习系统和项目,并利用这些知识解决一些来自不同领域的实际问题,包括零售、运输、电影、音乐、计算机视觉、艺术和金融。本书将教会你解决自己遇到的机器学习问题!
本书适合人工智能、机器学习、深度学习相关行业的从业者和学习者阅读。
适读人群 :本书适合人工智能、机器学习、深度学习相关行业的从业者和学习者阅读。 编辑推荐
● AI核心知识+多行业实战案例详解
● 涵盖零售、运输、电影、音乐、市场营销、计算机视觉和金融等实战案例,掌握开发核心技能
帮你掌握利用机器学习与深度学习识别和解决复杂问题所需的技能,深入讲解Python机器学习生态系统的实战案例,本书是你学习并成为AI行业成功从业者的完美指南。
第1步着重理解机器学习的概念和工具。
第2步详细介绍标准的机器学习流程,重点是数据处理分析、特征工程和建模等核心知识。
第3步深入讲解涉及不同领域和行业的多个实战案例,包括零售、运输、电影、音乐、市场营销、计算机视觉和金融等领域实战案例。
你将掌握:
● 学会执行端到端机器学习项目和系统。
● 学会使用行业标准化、开源、强大的机器学习工具和框架进行实战。
● 学会深入案例研究,剖析机器学习和深度学习在不同领域和行业中的实战应用。
● 学会使用广泛的机器学习模型,包括回归、分类和聚类等。
原书前言
数据是新的“石油”,而机器学习是一个强大的概念和框架,可以充分利用它。在这个自动化和充满智能系统的时代,机器学习和数据科学成为最热门的词汇并不令人惊讶。跨行业、企业和领域对数据科学领域的巨大兴趣和新投资清楚地展现了其巨大的潜力。智能系统和数据驱动的组织正在成为现实,工具和技术的进步只会帮助它进一步扩展。由于数据至关重要,因此对机器学习和数据科学从业人员的需求从未像现在这样旺盛。事实上,世界正面临着数据科学家短缺的情况。数据科学工作被称为“ 21世纪最性感的工作”,因此在该领域积累一些有价值的专业知识就变得更加有意义。
本书是方案解决者的指南,用于构建真实世界的智能系统。它采用了包含概念、方法论、实际示例和代码的三步法。本书通过遵循数据驱动的思维方式,帮助读者掌握解决机器学习与深度学习中复杂问题时所需的必要技能。使用真实世界的案例研究,利用流行的 Python机器学习生态系统,本书将成为你在学习机器学习的艺术和科学并成为成功从业者道路上的完美伴侣。本书中使用的概念、技术、工具、框架和方法将教会你如何成功思考、设计、构建和执行机器学习系统和项目。
本书将带你开始探索利用 Python机器学习生态系统及其各种框架和库的方法。本书的三步法首先侧重于围绕机器学习的基础知识以及相关工具和框架建立一个坚实的基础,之后强调构建机器学习流程的核心过程,最后利用这些知识解决一些来自不同领域的实际问题,包括零售、运输、电影、音乐、计算机视觉、艺术和金融。本书还涵盖了广泛的机器学习模型,包括回归、分类、预测、规则挖掘和聚类。本书还涉及深度学习领域的前沿方法和研究,包括迁移学习和与计算机视觉相关的案例研究(如图像分类和神经风格迁移)。每章都包含详细的概念、完整的实例、代码及详细的讨论。
本书的主要目的是为广泛的读者(包括 IT专业人员、分析师、开发人员、数据科学家、工程师和研究生)提供一种结构化的方法来获得与机器学习有关的基本技能,以及利用先进的机器学习技术和框架的足够知识,以便他们能够开始解决他们自己的现实问题。本书是以应用实践为核心内容,所以它不能完全满足你对有关机器学习算法、方法及其内部实现的深入概念和理论知识的需求。我们建议你再通过一些关于数据挖掘、统计分析、机器学习算法和方法的理论方面的书籍来补充知识,从而对机器学习的世界有更深入的了解。
关于作者
Dipanjan Sarkar
英特尔公司的数据科学家,班加罗尔国际信息技术学院的信息技术硕士,主要负责数据科学研究与分析、商业智能、实际项目和大型智能系统构建等研究、开发工作。他多年来从事分析工作,擅长统计、预测和文本分析,对数据科学和教育充满热情,也是Springboard教育平台的数据科学导师,帮助从业者提高数据科学和机器学习等领域的技能。他还撰写了多本关于R、Python、机器学习和数据分析的著作。此外,他还是相关书籍的技术审校者,并担任Coursera的课程测试员。此外他还热衷于研究新技术、金融市场、颠覆性初创企业、数据科学、人工智能和深度学习。
Raghav Bali
英特尔公司的数据科学家,班加罗尔国际信息技术学院的信息技术硕士,致力于推动主动的、数据驱动的IT项目。他主要从事数据科学与分析、商业智能以及基于机器学习的可扩展解决方案开发等工作,还曾在一些全球领先的企业中从事过ERP和财务项目开发等工作。他也是一位技术爱好者,喜欢研究新工具和技术。他还著有关于R、机器学习和数据分析的著作。
Tushar Sharma
英特尔公司的数据科学家,班加罗尔国际信息技术学院的信息技术硕士。他的工作涉及使用大量基础结构数据进行大规模开发分析的解决方案。他曾在金融领域工作,为知名金融公司开发可扩展的机器学习解决方案。他精通Python、R,以及Spark和Hadoop等大数据框架。他还著有关于R和社交媒体分析的著作。
目录
原书序言
原书前言
译者简介
第1部分 理解机器学习
第1章 机器学习基础 // 2
11 机器学习的需求 // 3
12 理解机器学习 // 6
13 计算机科学 // 12
14 数据科学 // 14
15 数学 // 15
16 统计学 // 20
17 数据挖掘 // 22
18 人工智能 // 22
19 自然语言处理 // 23
110 深度学习 // 24
111 机器学习方法 // 29
112 监督学习 // 30
113 无监督学习 // 33
114 半监督学习 // 36
115 强化学习 // 37
116 批量学习 // 37
117 在线学习 // 38
118 基于实例的学习 // 38
119 基于模型的学习 // 39
120 CRISP-DM处理模型 // 39
121 构建机器智能 // 45
122 真实案例研究:预测学生获取推荐 // 47
123 机器学习的挑战 // 55
124 机器学习的现实应用 // 55
125 总结 // 56
第2章 Python机器学习生态系统 // 57
21 Python简介 // 57
22 Python机器学习生态系统简介 // 62
23 总结 // 100
第2部分 机器学习流程
第3章 数据的处理、重整以及可视化 // 102
31 数据收集 // 103
32 数据描述 // 116
33 数据重整 // 117
34 数据汇总 // 128
35 数据可视化 // 130 36
总结 // 152
第4章 特征工程和特征选择 // 153
41 特征:更好地理解你的数据 // 154
42 重温机器学习流程 // 155
43 特征提取和特征工程 // 156
44 数值型数据的特征工程 // 160
45 分类型数据的特征工程 // 174
46 文本型数据的特征工程 // 183
47 时态型数据的特征工程 // 193
48 图像型数据的特征工程 // 197
49 特征缩放 // 211
410 特征选择 // 214
411 特征降维 // 221
412 总结 // 224
第5章 构建、调优和模型的部署 // 225
51 构建模型 // 226
52 模型评估 // 239
53 模型调优 // 248
54 模型解释 // 259
55 模型部署 // 265
56 总结 // 267
第3部分 真实案例研究
第6章 共享单车趋势分析 // 270
61 共享单车数据集 // 270
62 问题陈述 // 271
63 探索性数据分析 // 271
64 回归分析 // 278
65 建模 // 280
66 下一步 // 291
67 总结 // 292
第7章 电影影评的情感分析 // 293
71 问题陈述 // 294
72 设置依赖项 // 294
73 获取数据 // 295
74 文字的预处理与标准化 // 295
75 无监督的以词典为基础的模型 // 298
76 使用监督学习进行情感分类 // 306
77 传统的有监督的机器学习模型 // 308
78 较新的有监督的深度学习模型 // 310
79 高级的有监督的深度学习模型 // 316
710 分析情感的因果关系 // 323
711 总结 // 332
第8章 顾客分类和有效的交叉销售 /333/
81 在线零售交易记录数据集 // 333
82 探索性数据分析 // 334
83 顾客分类 // 337
84 交叉销售 // 350
85 总结 // 361
第9章 分析酒的类型和质量 // 362
91 问题陈述 // 362
92 设置依赖项 // 363
93 获取数据 // 363
94 探索性数据分析 // 364
95 预测建模 // 378
96 预测葡萄酒类型 // 379
97 预测葡萄酒质量 // 385
98 总结 // 397
第10章 分析音乐趋势和推荐 // 398
101 百万歌曲数据集品味画像 // 398
102 探索性数据分析 // 399
103 推荐引擎 // 407
104 推荐引擎库的注意事项 // 415
105 总结 // 416
第11章 预测股票和商品价格 // 417
111 时序数据及时序分析 // 417
112 预测黄金价格 // 423
113 股票价格预测 // 432
114 总结 // 445
第12章 计算机视觉深度学习 // 447
121 卷积神经网络 // 447
122 使用 CNN进行图像分类 // 448
123 使用 CNN的艺术风格转换 // 457
124 总结 // 467