《大数据科学技术研究》将通过大数据技术基础、大数据应用场景、大数据建模分析和预测等三个方面,深入浅出的结合相关理论基础和技术的应用,给出大数据技术应用案例,内容通俗易懂,便于读者学习。同时,根据当前数字时代需求,首先梳理分析计算机基础、计算机网络基础、大数据发展概论、大数据分析工具、python程序设计基础在大数据科学中的作用和应用,为读者打下坚实的理论基础,然后结合大数据应用案例,以及如何使用大数据科学技术,系统而生动地讲解了大数据科学技术的应用实践,将成为从事大数据科学技术从业人员参考书籍之一,适合作为网络空间安全、信息安全、计算机科学与技术、公安技术等相关学科专业本科高年级和研究生的教材,也可供高校教师,相关科研以及技术和管理人员等领域工作者参考和使用。
罗勇,男,博士,中国传媒大学,通信与信息系统专业;湖北警官学院信息技术系计算机科学与技术教研室主任,电子取证及可信应用湖北省协同创新中心研究员、法庭科学湖北省重点实验室成员、湖北省公安技术优势特色学科(群)成员。一直从事计算机科学技术与应用专业相关方向的教学与研究,出版专著一部,参编教材数部,公开发表学术论文数十篇。
第一部分 基础篇/1
第1章 计算机基础概述/2
11计算机的发展简史/2
12 计算机分类/3
13 计算机技术发展趋势/6
14 云计算技术/10
第2章 大数据概述/12
21 大数据的定义/12
22 大数据的历史/12
23 大数据的类型/13
24 大数据的特点/14
25 大数据处理的优势/15
26 大数据的重要性/15
27 商业智能与大数据的对比/16
28 大数据和数据仓库/16
29 大数据分析的分类/17
210 大数据环境中的关联技术/19
211 大数据分析面临的挑战/22
第3章 大数据科学技术/24
31 大数据科学技术概述/24
32 大数据采集与存储技术/25
33 大数据处理技术27
34 大数据分析与应用技术/29
35 典型行业数据类型分析/31
36 大数据安全与隐私保护技术/32
37 大数据科学技术的未来发展/33
第4章 大数据Hadoop生态体系/35
41 HADOOP安装配置过程 /35
42 HDFS/36
43 MapReduce/38
44 Hive/42
45 Spark /45
46 Spark SQL/48
第二部分 Python程序设计/51
第5章 开发工具介绍与安装/52
51 Python/52
52 Anaconda/53
53 Jupyter notebook/60
第6章 Python基本数据类型/63
61 Python算术运行/63
62 基本数据类型/65
第7章 数据结构/69
71 变量/69
72 列表/71
73 元组和字符串/75
74 字典和集合/78
75 数字数组/80
76 Pandas DataFrames/89
77 读写数据/98
78 Python编程结构/102
第8章 Python的数据分析/106
81 Python数据分析简介/106
82 探索性分析/106
第9章 基于Python预测建模/118
91 线性回归/118
92 逻辑回归/132
第三部分 基于Python的大数据实战案例/139
第10章 Python爬虫技术/140
101 Beautiful Soup/141
102 Scrapy/141
103 Selenium/142
104 Requests/143
105 Urllib3/143
106 LXML/144
107 Mechanical Soup/144
108 Python Web抓取工具之间的比较/145
109 基于Python的网络爬虫设计/146
第11章 基于Python爬虫的旅游评论分析/150
111 jieba分词 /151
112 自然语言处理工具NLTK/155
113 情感倾向分析方法概念及其模型/159
114 基于Python的情感倾向分析方法设计与实现/161
115 情感倾向分析方法的函数实现/164
116 情感倾向分析方法性能研究/167
117 小结/168
第12章 Python中的情感分析/169
121 情感分析的应用/169
122 数据收集/169
123 程序设计与实现170
124 小结/179
第13章 基于LSTM的电影评论分类研究/180
131 LSTM简介/180
132 IMDB电影评论数据集/181
133 LSTM网络搭建/183
134 LSTM电影评论分类/185
第14章 大数据时代网络安全/189
141 网络安全威胁/189
142 安全防御/193
143 网络安全威胁和趋势/196
144 移动网络攻击威胁/197
参考文献/201