本书分为7章,全面系统地对数据存储技术进行讲解,并采用大量案例完成实操,此提高教师课堂教学的时效性,强化学生的动手能力,将行业与专业核心技术贯穿始终。本书在深入企业调研的基础上,结合企业岗位需求,根据课程内容特点,采取任务驱动教学模式,确立职业岗位工作过程中工作任务,将工作任务内容转化为学习领域课程内容,与企业合作,共
本书是作者基于其多年的科研经验而撰写的聚类分析专著。全书从基础知识和实际应用两方面系统地介绍了聚类分析方法。基础知识部分阐述了聚类分析基本过程、数据预处理、相似度计算、验证指标、常见聚类方法原理和特点,并给出了应用实例和程序供读者参考。应用部分则针对高维数据非监督学习问题,分别以心电识别、脑电识别、行为识别以及智能材料
本书为一本大数据技术的入门书籍,介绍Hadoop大数据平台和Spark大数据平台及相关工具的原理,以及如何进行部署和简单开发。全书包含13章:第1、2章介绍如何为深入学习Hadoop和Spark做环境准备,包括VMware虚拟机的创建和CentOS操作系统安装。第3~6章介绍Hadoop大数据平台的基本原理,包括HDF
数据管道通过整合、清理、分析、可视化等方式来管理初始收集的数据流。ApacheAirflow提供了一个统一的平台,可以使用它设计、实施、监控和维护数据的流动。Airflow具有易于使用的UI、即插即用的选项以及灵活的Python脚本,这些都使Airflow能够非常轻松地完成任何数据管理任务。在《ApacheAirflo
本书基于“基础知识”+“代码示例”+“应用案例”的模式编写,共包括7个项目。项目1主要介绍互联网数据采集的入门知识;项目2通过一个入门级的简单案例,介绍互联网数据采集的基本流程;项目3通过一个进阶的案例,详细介绍在没有给出官方开放API的情况下,如何通过抓包工具获取XHR请求地址;项目4主要介绍HTML文档数据的采集,
文本数据挖掘是通过机器学习、自然语言处理和推理等相关技术或方法,理解、分析和挖掘文本的内容,从而完成信息抽取、关系发现、热点预测、文本分类和自动摘要等具体任务的信息处理技术。《文本数据挖掘(第2版)》主要介绍与文本数据挖掘有关的基本概念、理论模型和实现算法,包括数据预处理、文本表示、文本分类、文本聚类、主题模型、情感分
本书系统介绍了智能调度领域的理论知识,清晰地勾勒出智能调度的知识体系。全书共7章,分别是:绪论、智能调度的理论基础、单机调度问题、并行机调度问题、开放车间调度、流水车间调度和作业车间调度。全书系统、深入浅出地讲解了智能调度的理论知识,同时强化了各调度类型的数学模型和优化方法,重点培养分析问题与解决调度问题的能力。为帮助
本书为普通高等教育十一五国家级规划教材。本书从工程应用的角度出发,注重基础性、系统性和实用性,较深入地介绍计算机控制系统的基本知识、分析和设计方法。全书共10章,包括:绪论、计算机控制系统设计的硬件基础、计算机控制系统的数学基础、计算机控制系统特性分析、计算机控制系统的间接设计方法、计算机控制系统的直接设计方法、数字控
本书系统地介绍了Hadoop、Spark、Flink等开源大数据组件的相关知识和实践技能。全书共9章,涉及大数据采集、大数据存储与管理、大数据处理与分析等大数据应用生命周期中各阶段典型组件的部署、使用和基本编程方法,内容包括部署全分布模式Hadoop集群、HDFS实战、MapReduce编程、部署ZooKeeper集群
本书介绍了克服日常面临的各种挑战的实践知识,以及各种数据科学解决方案,主要包括数据科学概论,机器学习模型测试,人工智能基础,理想的数据科学团队,数据科学团队招聘面试,组建数据科学团队,创新管理,管理数据科学项目,数据科学项目的常见陷阱,创造产品与提升可重用性,实施ModelOps,建立技术栈和结论。本书的目标读者是希望