近年来,我国大气污染问题随国民经济与城市化进程的高速发展而日益严峻,尤其是以雾霾为代表的恶性天气频频发生,引发学术界对雾霾污染成因及危害的研究。国内外专家研究雾霾成因的成果较多,而涉及雾霾污染问题的统计分析较少。统计分析所抽取的随机样本主要依赖于结构性数据,即行数据(存储在数据库里,可用二维表结构表达实现的数据),难以对纷扰繁杂的雾霾污染的非结构化数据(文本、图像、信号、音频、视频等)进行分析;而大数据分析可以解决非结构化数据的融合及整合问题。
本书首先进行了雾霾污染的成因、特征及防控传导机制的分析,具体包括科学地界定雾霾(包含PM2.5)概念、阐述雾霾污染的特性、雾霾污染问题的影响途径以及防控雾霾污染传导机制;进行相关理论基础与测度方法设计,包括阐述涉及雾霾污染问题相关理论基础(包括社会学、经济学、生态学、统计学、计算机科学、系统科学等)、界定大数据概念和基本特征、阐述雾霾污染问题的数据分析和算法系统理论与测度方法、归纳并设计基于大数据关联分析的中国雾霾污染问题统计理论。
其次,进行雾霾污染问题的大数据分析和算法系统的构建,具体包括:依托雾霾污染大数据平台,进行雾霾污染问题数据库管理、大数据价值链挖掘,通过大数据关联分析、云计算及系统科学方法,依据系统建立的基本原则,建立雾霾污染问题的数据分析和算法系统。
再次,基于结构化数据关联性分析方法,进行雾霾污染问题统计研究,包括:基于城市雾霾数据采集与污染判断预测软件系统进行数据挖掘,构建结构化数据,应用传统统计学方法,进行雾霾污染对人身危害、引发社会关注度区域性差异、对农业和交通运输业以及旅游业等国民经济相关行业的影响分析。
再次,基于非结构化数据关联分析方法,进行雾霾污染问题的统计研究,包括:基于BP神经网络方法的上海市入境游客关注点分析,基于SVR-AR-MA模型的呼吸道疾病门诊量预测,基于社交评论情感分析的网民雾霾情绪识别,基于改进KNN-BP神经网络的PM2.5浓度预测模型研究。
再次,进行京津冀区域城市雾霾污染网络分析,即在基于节点重要性评价的京津冀城市静态雾霾污染网络实证分析后,又基于动态非对称尾部相关性进行动态网络实证分析。
最后,提出完善雾霾污染治理措施的政策建议,在进行区域一体化雾霾治理效率评估分析基础上,根据分析结论验证大数据关联分析测度方法的科学性、有效性与普适性,提出我国区域一体化雾霾治理的路径选择和完善雾霾污染治理措施的政策建议。
高广阔,复旦大学经济学硕士、博士及工商管理学博士后,上海理工大学管理学院教授、博士生导师,2010.2—2010.7意大利摩德纳一雷焦艾米里亚大学经济学院客座教授、研究员,2010.8—2013.9美国亚利桑那州立大学生命科学院可持续发展研究中心高级访问学者。近年来在雾霾污染的大数据分析、低碳经济与产业结构调整、能源开发与利用、环境产业、生态文明建设评估及可持续发展管理等方面进行了很有成效的研究,已出版《气候变化与中国产业结构调整研究》《环境产业经济学》《跨国公司绿色管理》专著3部和译著2部;在经济管理核心类期刊发表论文100余篇,其中包括《中国工业经济》《管理世界》《改革》《中国人口·资源与环境》《环境科学学报》《上海经济研究》等;SCI、EI收录论文50余篇;承担或参与了国家社会科学基金、国家自然科学基金、省部级及地市级“十二五”“十三五”和“十四五”规划项目与研究课题60余项,受到国内外专家好评。
内容提要
第一章 绪论
1.1 研究的主要问题、国内外研究现状述评及价值
1.1.1 问题的提出:雾霾污染问题测度方法亟待改进
1.1.2 国内外研究现状述评
1.1.3 研究目标与研究价值
1.2 研究的思路、方法和内容
1.2.1 研究思路与技术路线
1.2.2 研究方法
1.2.3 研究范围及研究对象
1.2.4 研究内容与论文框架
参考文献
第二章 雾霾污染的成因、特征及传导机制分析
2.1 雾霾的概念与成因
2.1.1 雾霾的概念与成分
2.1.2 PM2.5的定义及其与雾霾的关系
2.1.3 雾霾的危害
2.2 中国雾霾污染的特性
2.2.1 雾霾污染的特性
2.2.2 中国雾霾频发的成因分析
2.3 雾霾污染问题传导机理分析
2.3.1 污染物组成
2.3.2 污染来源
2.3.3 扩散条件
2.3.4 雾霾污染的影响途径
参考文献
第三章 相关理论基础与测度方法设计
3.1 引言
3.2 雾霾污染问题相关理论基础
3.2.1 雾霾污染问题与社会学
3.2.2 雾霾污染问题与经济学
3.2.3 雾霾污染问题与生态学
3.2.4 雾霾污染问题与统计学
3.2.5 雾霾污染问题与计算机科学
3.2.6 雾霾污染问题与系统科学
3.3 大数据概念界定和特征分析
3.3.1 大数据内涵
3.3.2 大数据基本特征
3.3.3 大数据技术的理性分析
3.4 雾霾污染问题的数据分析和算法系统理论与测度方法
3.4.1 雾霾污染问题的数据分析和算法系统理论
3.4.2 雾霾污染问题的测度方法
3.5 基于大数据关联分析的中国雾霾污染问题统计方法论设计
3.5.1 设计思想
3.5.2 Python技术概述
3.5.3 大数据挖掘技术
3.5.4 机器学习理论
3.5.5 人工神经网络理论
3.5.6 长短期记忆网络理论
3.5.7 支持向量机理论
3.6 本章小结
参考文献
第四章 雾霾污染问题的大数据分析和算法系统的构建
4.1 引言
4.1.1 系统设计与开发的背景
4.1.2 系统设计与开发的目的
4.1.3 系统设计与开发的意义
4.1.4 软件源文档组织架构说明
4.2 系统可行性分析
4.2.1 可行性分析概述
4.2.2 经济可行性分析
4.2.3 技术可行性分析
4.2.4 系统结构可行性分析
4.2.5 运营管理可行性分析
4.2.6 市场可行性分析
4.2.7 可行性分析结论
4.3 系统开发理论与工具
4.3.1 系统开发理论——面向对象开发方法
4.3.2 系统开发工具
4.4 城市雾霾数据采集与污染判断预测软件的分析
4.4.1 UML概述
4.4.2 用例图
4.4.3 UML静态图
4.4.4 UML动态图
4.5 城市雾霾数据采集与污染判断预测软件的设计与开发
4.5.1 数据库设计
4.5.2 系统开发
4.6 城市雾霾数据分析
4.6.1 应用软件及方法
4.6.2 数据分析结果
4.6.3 数据分析
4.7 本软件开发过程的总结
4.7.1 本软件开发总结
4.7.2 本软件的难点
第五章 基于结构化数据关联性分析的中国雾霾污染问题统计研究
5.1 引言
5.2 雾霾污染对人身危害的影响分析
5.2.1 引言
5.2.2 资料与方法
5.2.3 结果与讨论
5.2.4 PM2.5与心血管内科门急诊量的泊松广义相加模型的拟合
5.2.5 PM2.5与皮肤科门急诊量的泊松广义相加模型的拟合
5.2.6 结论
5.2.7 建议
5.2 雾霾污染引发社会关注度区域性差异影响因素分析
5.2.1 引言
5.2.2 变量选取与数据来源
5.2.3 模型构建与实证分析
5.2.4 结论与建议
5.3 雾霾污染对国民经济相关行业的影响分析
5.3.1 雾霾污染对农业的影响分析
5.3.2 雾霾污染对交通运输业的影响分析
5.3.3 雾霾污染对旅游业中入境客流量的影响分析
参考文献
第六章 基于非结构化数据关联分析的雾霾污染问题的统计分析
6.1 引言
6.2 基于BP神经网络方法的上海市入境游客关注点分析
6.2.1 引言
6.2.2 数据说明与研究方法
6.2.3 实证分析
6.2.4 结论与讨论
6.3 基于SVR-ARMA模型的呼吸道疾病门诊量预测
6.3.1 引言
6.3.2 呼吸道疾病门诊量预测模型
6.3.3 实验结果与分析
6.3.4 基于SVR-ARMA模型的雾霾污染环境下呼吸道疾病门诊量预测
6.3.5 结论与建议
6.4 基于社交评论情感分析的网民雾霾情绪识别
6.4.1 引言
6.4.2 文献综述
6.4.3 数据来源与研究方法
6.4.4 结果与分析
6.4.5 结论
6.4.6 建议
6.5 基于改进KNN-BP神经网络的PM2.5浓度预测模型研究
6.5.1 引言
6.5.2 基于带权重的KNN-BP神经网络的PM2.5浓度预测
6.5.3 试验结果与分析
6.5.4 结论
6.6 基于LSTM的空气质量指数预测
6.6.1 LSTM网络模型构建
6.6.2 数据来