Linux是一个自由开放的操作系统,集成了很多高效便捷的开发工具,大数据应用进一步推动了市场对Linux人才的需求,促进了Linux系统的发展。《Linux系统与大数据应用》共分成三篇,**篇包括7章,主要面向初学者,分别从系统使用者、网络管理者、shell程序开发者、应用程序开发者和内核开发者的角度,全方位地介绍Linux操作环境、操作命令,以及基本的开发方法;第二篇包括3章,主要面向大数据应用的开发者,介绍基于Linux系统的大数据计算平台、存储平台,以及几个广泛使用的应用开发和分析工具;第三篇是实验,使读者从初步认识Linux,熟练使用shell命令,掌握系统管理原理,到熟悉基于Linux的大数据开发平台,并学会几种典型的大数据存储和开发方法。《Linux系统与大数据应用》内容精简,知识覆盖面广,适合作为计算机科学、软件工程、网络工程等专业本科生教材,也可供基于开源平台的大数据应用开发工程技术人员参考。
第一篇 Linux系统
第1章 Linux系统概述
1.1 Linux系统的产生
1.1.1 GNU
1.1.2 GPL
1.1.3 LGPL
1.1.4 POSIX
1.1.5 GNU/Linux
1.2 Linux系统的发展
1.2.1 早期Linux系统
1.2.2 Linux内核版本
1.2.3 Linux发行版本
1.2.4 Linux体系架构
1.3 Linux系统的应用
1.3.1 桌面应用
1.3.2 服务器应用
1.3.3 嵌人式应用
1.3.4 评价
1.4 Linux系统终端
1.4.1 Xwindow
1.4.2 KDE
1.4.3 GNOME
1.4.4 其他桌面
1.5 shell命令
1.5.1 shell命令介绍
1.5.2 shell命令使用
1.5.3 联机帮助命令
1.6 本章小结
习题1
第2章 文件管理
2.1 LiBUX文件
2.1.1 文件名
2.1.2 文件类型和属性
2.1.3 Linux系统目录结构
2.2 文件系统
2.2.1 文件系统分类
2.2.2 Ext2/Ext3/Ext4文件系统分析
2.2.3 硬链接与符号链接
2.3 设备文件
2.3.1 设备文件挂载
2.3.2 设备文件卸载
2.3.3 设备文件自动挂载配置
2.3.4 几种特殊的设备文件
2.4 文件操作sheU命令
2.4.1 文件内容显示
2.4.2 文件查询
2.4.3 文件及文件系统管理
2.4.4 几个功能强大的命令
2.5 本章小结
习题2
第3章 用户与组管理
3.1 用户与组账号
3.1.1 账号
3.1.2 用户账号配置文件
3.1.3 组账号配置文件
3.2 账号管理命令
3.3 用户与文件系统空间
3.3.1 主目录
3.3.2 用户与磁盘空间
3.4 文件权限管理
3.4.1 文件权限管理概述
3.4.2 文件特殊权限
3.5 系统安全性
3.5.1 账号安全性
3.5.2 常见漏洞安全性
3.5.3 SELinux
3.6 本章小结
习题3
第4章 网络及其服务配置
4.1 网络配置
4.1.1 相关系统文件
4.1.2 常用网络命令
4.1.3 OpenSSH
4.2 Web服务器
4.2.1 Apache HTTP Server
4.2.2 安装与配置实例
4.3 FTP服务器
4.3.1 vsFTP
4.3.2 安装与配置实例
4.4 Samba服务器
4.4.1 Samba简介
4.4.2 安装与配置实例
4.5 其他服务器
4.5.1 邮件服务器
4.5.2 DNS服务器
4.5.3 DHCP服务器
4.6 本章小结
习题4
第5章 内核及其配置
5.1 Linux内核文件组织结构
5.2 内核构建
5.2.1 内核引导与启动
5.2.2 内核引导管理器
5.2.3 内核编译
5.3 系统调用
5.3.1 系统调用的实现
5.3.2 增加系统调用
5.4 本章小结
习题5
第6章 sheU编程扩展
6.1 文本编辑器
6.1.1 vi编辑器
6.1.2 vim编辑器
6.1.3 emacs编辑器
6.1.4 Gedit编辑器
6.2 sheII
6.3 bash编程
6.3.1 关于bash
6.3.2 变量
6.3.3 操作符
6.3.4 条件和test命令
6.3.5 shell流控制
6.3.6 函数
6.4 其他shell编程
6.4.1 sed
6.4.2 grep
6.4.3 awk
6.5 本章小结
习题6
第7章 应用开发
7.1 程序安装与配置
7.1.1 安装程序与更新软件
7.1.2 设置环境变量
7.2 C程序开发
7.2.1 gcc
7.2.2 make工具与makefile文件
7.2.3 c程序开发实例
7.3 Java程序开发
7.3.1 Ant
7.3.2 Maven
7.3.3 Eclipse
7.4 Web开发
7.4.1 LAMP
7.4.2 LAMP加速
7.4.3 应用
7.5 版本控制
7.5.1 VCS
7.5.2 CVS
7.5.3 Subversion
7.5.4 Git
7.6 本章小结
习题7
第二篇 大数据应用
第8章 大数据开发平台
8.1 大数据
8.1.1 大数据的特点
8.1.2 Hadoop与大数据
8.2 Hadoop与MapReduce
8.2.1 Hadoop框架及组件介绍
8.2.2 分布式文件系统HDFs
8.2.3 并行编程框架MapReduce
8.2.4 Hadoop应用示例1
8.2.5 Hadoop应用示例2
8.3 基于内存计算与spark
8.3.1 Spark介绍
8.3.2 Spark应用示例
8.4 实时计算与storm
8.4.1 Storm介绍
8.4.2 Storm应用示例1
8.4.3 Storm应用示例2
8.5 本章小结
习题8
第9章 大数据存储
9.1 NoSQL介绍
9.1.1 NoSQL发展
9.1.2 NoSQL特征
9.1.3 NoSQL分类
9.2 HBase数据库
9.2.1 HBase介绍
9.2.2 HBase应用示例
9.3 OpenTSDB数据库
9.3.1 OpenTSDB介绍
9.3.2 OpenTSDB应用示例
9.4 本章小结
习题9
第10章 大数据分析工具
10.1 Hive数据分析平台
10.1.1 Hive的组成
10.1.2 Hive和RDBMS的区别
10.1.3 Hive应用示例
10.2 Pig数据分析平台
10.2.1 Pig简介
10.2.2 Pig与Hive
10.2.3 Pig应用示例
10.3 Mahout数据挖掘平台
10.3.1 Mahout简介
10.3.2 安装与配置
10.3.3 Mahout应用示例
10.4 本章小结
习题10
第三篇 实验
实验1 系统安装与基本使用
实验2 文件及文件系统管理
实验3 用户与权限管理
实验4 网络及其服务管理
实验5 内核定制与编程
实验6 shell编程
实验7 应用开发
实验8 Hadoop安装、部署与应用
实验9 Spark安装、部署与应用
实验10 Storm安装、部署与应用
参考文献