本书紧贴计算机领域,从程序员的需求出发,精心挑选了程序员真正用得上的数学知识,通过生动的案例来解读知识中的难点,使程序员更容易对实际问题进行数学建模,进而构建出更优化的算法和代码。本书共分为三大模块:“基础思想”篇梳理编程中常用的数学概念和思想,既由浅入深地精讲数据结构与数学中基础、核心的数学知识,又阐明数学对编程和算法的真正意义;“概率统计”篇以概率统计中核心的贝叶斯公式为基点,向上讲解随机变量、概率分布等基础概念,向下讲解朴素贝叶斯,并分析其在生活和编程中的实际应用,使读者真正理解概率统计的本质,跨越概念和应用之间的鸿沟;“线性代数”篇从线性代数中的核心概念向量、矩阵、线性方程入手,逐步深入分析这些概念是如何与计算机融会贯通以解决实际问题的。除了理论知识的阐述,本书还通过Python语言,分享了通过大量实践积累下来的宝贵经验和编码,使读者学有所用。 本书的内容从概念到应用,再到本质,层层深入,不但注重培养读者养成良好的数学思维,而且努力使读者的编程技术实现进阶,非常适合希望从本质上提升编程质量的中级程序员阅读和学习。
适读人群 :有一定数据结构和编程经验的程序员,人工智能和机器学习算法的初级到中级学习者
1.紧紧围绕程序员的需求。
数学的课题非常广泛,但本书没有涉及数学领域的全部课题,而是从程序员的需求出发,精心挑选了编程所需的常用知识点,并实现学以致用。
2.结合生动的案例和形象的比喻解读难点。
降低技术理解的门槛,让程序员更容易理解数学背后的逻辑,并对实际生产问题进行数学建模,进而设计出更有效的算法,编写出更优雅的代码。
3.注重编程实践。
除了阐述理论知识,书中还提供了要通过大量实践才能积累的宝贵经验,让读者有机会亲自动手编写Python 代码,进而加深理解。
4.提供源代码下载。
黄申,博士,2015 年美国杰出人才,微软学者,IBM ExtremeBlue天才计划成员,KDD WISDOM'20主席。2006年博士毕业于上海交通大学计算机科学与工程专业,师从俞勇教授,发表过20 余篇国际论文,拥有30多项国际专利。
有20多年机器学习和大数据领域的经验,现任Glassdoor机器学习资深研发经理,曾任职于LinkedIn全球数据科学部、微软亚洲研究院、IBM研究院、eBay中国研发中心,1号店和***飞牛网。
著有《大数据架构和算法实现之路:电商系统的技术实战》《大数据架构商业之路:从业务需求到技术方案》两本原创技术图书,并翻译出版了《Elasticsearch实战》《Python机器学习实践指南》等技术图书,在极客时间发表了专栏《程序员的数学基础课》。
第 一篇 基础思想1
第 1章 二进制、余数和布尔代数2
1.1 二进制2
1.1.1 二进制计数法2
1.1.2 二进制的位操作3
1.1.3 负数的二进制表示11
1.2 余数15
1.2.1 求余和同余定理15
1.2.2 哈希16
1.2.3 奇偶校验17
1.2.4 交叉验证19
1.3 布尔代数19
1.3.1 逻辑19
1.3.2 集合23
第 2章 迭代、数学归纳和递归30
2.1 迭代法30
2.1.1 迭代法简介30
2.1.2 迭代法的应用31
2.2 数学归纳法37
2.3 递归41
2.3.1 从数学归纳法到递归42
2.3.2 分而治之44
2.4 迭代法、数学归纳法和递归的关联56
第3章 排列、组合和动态规划58
3.1 排列58
3.2 组合62
3.3 动态规划65
3.3.1 编辑距离66
3.3.2 状态转移67
3.3.3 状态转移方程和编程实现70
3.3.4 动态规划解决最优组合72
第4章 树和图74
4.1 图和树的概念74
4.2 树的常见应用77
4.2.1 WordNet中的关联词77
4.2.2 二叉树81
4.3 树的深度优先搜索和遍历83
4.3.1 前缀树的构建和查询83
4.3.2 深度优先的实现88
4.4 树和图的广度优先搜索和遍历94
4.4.1 社交网络中的好友问题94
4.4.2 实现社交好友推荐99
4.4.3 如何更高效地求两个用户间的最短路径104
4.4.4 更有效的嵌套型聚合111
4.5 图中的最短路径114
4.5.1 基于广度优先或深度优先搜索的方法115
4.5.2 一个优化的版本:Dijkstra算法116
第5章 编程中的数学思维126
5.1 数据结构、编程语言和基础算法126
5.1.1 数据结构126
5.1.2 编程语句128
5.1.3 基础算法128
5.2 算法复杂度分析129
5.2.1 复杂度分析的原理和法则130
5.2.2 复杂度分析的案例134
第二篇 概率统计138
第6章 概率和统计基础139
6.1 概论和统计对于编程的意义139
6.1.1 概率和统计的概念139
6.1.2概率和统计可以做什么140
6.2 随机变量、概率分布和期望值141
6.2.1 随机变量141
6.2.2 概率分布142
6.2.3 期望值157
6.3 联合概率、条件概率和贝叶斯定理159
6.3.1 联合概率、条件概率和边缘概率159
6.3.2 贝叶斯定理162
6.3.3 随机变量之间的独立性163
第7章 朴素贝叶斯分类165
7.1 原始信息的转换165
7.2 朴素贝叶斯的核心思想166
7.3 基于朴素贝叶斯算法的文本分类170
7.3.1 文本分类系统的基本框架170
7.3.2 自然语言的预处理171
7.3.3 朴素贝叶斯模型的构建174
7.3.4 朴素贝叶斯模型的预测176
7.3.5 朴素贝叶斯分类的实现177
第8章 马尔可夫过程181
8.1 语言模型181
8.1.1 链式法则181
8.1.2 马尔可夫假设181
8.1.3 模型推导182
8.2 语言模型的应用183
8.2.1 信息检索183
8.2.2 中文分词184
8.3 马尔可夫模型184
8.4 隐马尔可夫模型188
8.4.1 模型的原理188
8.4.2 模型的求解192
8.4.3 模型的实现195
第9章 信息熵200
9.1信息熵和信息增益200
9.1.1 性格测试中的信息熵200
9.1.2 信息增益203
9.2 通过信息增益进行决策204
9.2.1 通过信息熵挑选合适的问题204
9.2.2 几种决策树算法207
9.3 特征选择209
9.3.1 特征选择209
9.3.2 利用信息熵进行特征选择209
9.3.3 利用卡方检验进行特征选择210
第 10章 数据分布212
10.1 特征变换212
10.1.1 为什么需要特征变换212
10.1.2 两种常见的特征变换方法214
10.2 统计意义217
10.2.1 显著性差异219
10.2.2 统计假设检验和显著性检验220
10.2.3 P值220
10.2.4 不同的检验方法221
10.3 拟合、欠拟合和过拟合及其处理229
10.3.1 拟合、欠拟合和过拟合229
10.3.2欠拟合和过拟合的处理233
第三篇 线性代数235
第 11章 线性代数基础236
11.1 向量和向量空间236
11.1.1 向量的概念236
11.1.2 向量的运算239
11.1.3 向量空间244
11.2 矩阵250
11.2.1 矩阵的运算250
11.2.2 矩阵运算的几何意义252
第 12章 文本处理中的向量空间模型256
12.1 信息检索256
12.1.1 信息检索的概念256
12.1.2 信息检索中的向量空间模型257
12.2 文本聚类259
12.2.1 聚类算法的概念259
12.2.2 使用向量空间进行聚类260
12.3 文本分类263
第 13章 对象间关系的刻画——矩阵267
13.1 PageRank的矩阵实现267
13.1.1 PageRank算法的回顾267
13.1.2 简化PageRank公式267
13.1.3 考虑随机跳转269
13.1.4 代码的实现270
13.2 用矩阵实现推荐系统272
13.2.1 用矩阵实现推荐系统的核心思想272
13.2.2 基于用户的过滤272
13.2.3 基于物品的过滤277
第 14章 矩阵的特征279
14.1 主成分分析(PCA)279
14.1.1 PCA的主要步骤279
14.1.2 PCA背后的核心思想286
14.2 奇异值分解(SVD)288
14.2.1 方阵的特征分解288
14.2.2 矩阵的奇异值分解289
14.2.3 潜在语义分析和SVD291
第 15章 回归分析294
15.1 线性方程组294
15.1.1 高斯消元法295
15.1.2 使用矩阵实现高斯消元法296
15.2 最小二乘法299
15.2.1 通过观测值的拟合300
15.2.2 最小二乘法302
15.2.3 补充证明和解释303
15.2.4 演算示例305
第 16章 神经网络311
16.1 神经网络的基本原理311
16.2 基于TensorFlow的实现317
16.3 Word2Vec327