本书阐述的是:在一个相互联系而又彼此扰动的复杂世界里,现实政治的数据化进程与基于数据的政治分析技巧,特别是如何利用数据分析技术来洞察政治变动和复杂人际关系的可行性。在研究设计上,本书主要沿着两条线索展开:一条线索立足政治实践,试图通过阐述大数据和机器学习技术在现代政治中的应用,来理解现代政治中信息的生产、聚合和传递规律,以此窥探数据精英的崛起和新的社会权力重组,这部分内容主要涉及政治选举中的高频统计、数据外交和冲突预测;而另外一条线索则关乎跨学科的理论融合与阐释,重点梳理了几个经典数据分析理念和机器学习原理,内容涵括政治文本中的数据挖掘与情感分析、政治关系中的社交网络与度量,以及基于神经网络的社会感知预测。
董青岭,对外经济贸易大学国际关系学院副教授、国家信息中心博士后工作站信息管理科学博士后,2009年6月毕业于外交学院国际关系研究所,获法学博士学位,当前主要从事大数据科学、人工智能与国际关系问题的交叉研究,业已在《世界经济与政治》《外交评论》《国际政治研究》《欧洲研究》以及《国际政治科学》等主流期刊发表国际关系论文十余篇,出版专著《复合建构主义:进化冲突与进化合作》一部,主持“基于大数据驱动的外交决策模式创新与我国实践路径研究”“基于开源数据分析的国际安全态势感知与冲突预测模型研究”等国家社科基金、教育部人文社科基金以及中国博士后科学基金和校级科研课题多项。
绪论争论中的大数据、机器学习与未来政治()
上篇数据主义
第一章数据军团:权力政治的算法角逐()
第一节复杂社会的演进:决策的相互扰动()
第二节同意的社会计算:传统民调的罪与罚()
第三节数据较量:美国大选幕后的算法操盘手()
第二章高频统计:选举中的政治预测()
第一节贝叶斯定理:纳特·西尔弗和他的538网站()
第二节预测偏差:538网站的数据陷阱()
第三节另类统计:最高频争议即为最大影响力()
第三章数据外交:一场即将到来的外交革命()
第一节从数字外交到数据外交:数据力量的崛起()
第二节从技术变革到当前争议:外交决策的数据冲击()
第三节从理论假说到案例实践:数据驱动的外交创新()
第四节未来前景与关键障碍:数据外交的拓展空间()
下篇数据原理
第四章文本分析:情感与意图的自动识别()
第一节分词原理:非结构化数据的结构化处理()
第二节情感分析:挖掘文本叙述中的情绪波动()
第三节主题模型:探索政治文本的隐含语义结构()
第五章社会网络:圈子里的政治文化()
第一节社会网络:以关系为中心的政治度量()
第二节强联系与弱联系:政治系统中的信息传递()
第三节中心性分析:发掘政治网络中的关键节点()
第六章机器学习:暴力冲突的社会感知()
第一节谢林模型:从计算机模拟到机器学习()
第二节学习原理:从有监督学习到无监督学习()
第三节神经网络:仿生人脑与社会情景的模式识别()
第四节预警未来:冲突预测的当前障碍()
参考文献()