数据科学理论与实践（第2版）_朝乐门_9787302531913

重点介绍数据科学中的新理论和代表性实践，填补数据科学与大数据技术专业的核心教材的空白。主要内容包括：基础理论（术语定义、研究目的、发展简史、理论体系、基本原则、数据科学家）、理论基础（数据科学的学科地位、统计学、机器学习、数据可视化）、流程与方法（基本历程、数据加工、数据审计、数据分析、数据可视化、数据故事化、项目管理）、技术与工具（技术体系、MapReduce、Hadoop、Spark、NoSQL与NewSQL、R与Python）、数据产品及开发（主要特征、关键活动、数据柔术、数据能力、数据战略、数据治理）、典型案例及实践等

前言
自第1版出版以来，本教材得到了国内外专家的高度评价。目前，国内多数高校的相关课程均选择本教材为指定教材或主要参考书。本书第2版中进行了如下修订。
（1）调查研究国内外大数据与数据科学相关工作岗位的用人要求及岗位面试题，对第1版内容进行了删减与补充。例如，新增了Lambda架构、A/B测试、Tableau、VizQL技术、大数据/算法偏见、大数据算法与模型、Jupyter Notebook/Lab、Python编程等面试中常见的问题。同时，还补充了数据产品开发、Python/R数据分析等内容，力争使本教材具备更高的实用价值和更多的干货知识。
（2）调查研究国内外大数据与数据科学相关的国际/国家标准、调研报告和理论研究现状，补充了必要的标准、报告和理论，如《信息技术大数据术语》（GB/T 352952017）、《信息技术大数据技术参考模型》（GB/T 355892017）、《信息技术服务治理第5部分：数据治理规范》（GB/T 34960.52018）、《数据管理能力成熟度评估模型》（GB/T 360732018）以及来自Gartner、DataCamp、KDnuggets等专业机构的著名调查报告，力争全景展现国内外数据科学领域的重要理论与代表性实践。
（3）在深入研究世界一流大学数据科学课程的教材建设、教学大纲和教学内容的基础上，广泛征求兄弟院校师生就本教材第1版的意见与建议，对本书内容进行了补充和调整，如全书例题采用Python和R双语言版本，并补充了一些经典小理论、案例及其数据科学的内在联系，如亚马逊预期货运（Amazons Anticipatory Shipping）、幸存者偏差（Survivorship Bias）、辛普森悖论（Simpsons Paradox）、大数据杀熟、Google图片搜索Idiot事件、Facebook -剑桥分析公司数据丑闻（FacebookCambridge Analytica Data Scandal）、P2DR模型和奥卡姆剃刀(Occams Razor)，力争使本教材与世界顶级大学接轨。
（4）结合自己在中国人民大学开设的数据科学（本科）、数据科学理论与实践（硕士）、信息分析前沿研究（博士）课程以及建设国家精品开放在线课程数据科学导论的教学经验以及在企事业单位担任首席数据科学家和参与部分高校数据科学专业建设的经验，并结合自己在数据科学与大数据技术领域的学术研究，对第1版内容进行了调整与优化，突显了数据产品开发在数据科学教与学中的抓手地位，并按照本人首次提出的开源课程倡议，在GitHub上建立配套社区，与同行老师共同维护课程资源，使本教材的内容更加符合我国大数据人才培养的需求。
本书旨在系统讲解数据科学领域的经典理论与最佳实践，满足不同层次读者的需求。因此，建议读者结合自己的教学或学习需要，对本书进行定制使用，参考方案如表1所示。

表1本教材的教学与学习建议

章名
导论类课程非导论类课程
非大数据类
专业大数据类
专业本科
低年级本科高年级
或硕士

第1章基础理论
第2章理论基础〖5〗
第3章流程与方法〖3〗
第4章技术与工具〖3〗
第5章数据产品及开发〖4〗
第6章典型案例及实践

注：与数据科学相关的导论类课程有数据科学导论、大数据导论、数据科学与大数据技术导论等；非导论类课程有数据科学、数据科学理论与实践、数据科学原理与实践、数据科学方法与技术等；常见的大数据类专业有数据科学与大数据技术、大数据管理与应用、大数据技术与应用和大数据分析等。
作者以本教材为基础，将提供MOOC公开课，帮助培养数据科学领域的人才。
朝乐门
2019年6月

你还可能感兴趣

我要评论