数据清洗基础与实践
定 价:22 元
丛书名:人工智能与大数据系列丛书
数据的清洗是在大数据的挖掘与分析过程中的一个重要环节,由于数据类型的复杂性,采用传统的清洗脏数据的工作会辛苦和乏味。但是如果能利用好的清洗工具和适当的方法则可以让数据的清洗工作变得有趣并能达到事半功倍的效果。本书从文件格式、数据类型、字符编码等基本概念入手,通过实例,探讨了如何提取和清洗关系型数据、网页数据,以及如何实现数据的转换与加载。每个知识点都附有案例供读者学习,通过实践让读者掌握所有的数据清洗技术。如果您是一位数据科学家,或者从事数据科学工作,哪怕是一个对数据科学感兴趣的新手,那么很高兴本书适合您阅读。
生于1980年1月,讲师/项目监理师,硕士,重庆工程学院人工智能与大数据系教师,主要从事人工智能与医疗大数据的研究。自2015年以来主持商业医疗大数据项目3项,产值千万元以上。公开发表论文7篇(EI检索1篇)、主持、参与校级自然科学基金项目1项 、主持、参与建设校级重点课程1门 、主编、参与出版教材(教学讲义)3部