本书列举了现实生活中的警世故事进一步说明了数据科学伦理的重要性和潜在影响;并阐述不同的概念和技术,帮助读者理解从k匿名和差异隐私同态加密和零知识证明以解决隐私问题,消除歧视敏感群体的技术和各种可解释的人工智能技术。书中穿插着结构化的练习,提供假设的场景和伦理困境,教读者如何平衡伦理问题和数据的效用。
[比]大卫·马滕斯(David Martens)
比利时安特卫普大学工程管理系的数据科学教授。他教授研究生商业经济学和商业工程的数据挖掘、数据科学和伦理学等课程。他长期致力于研究可解释的人工智能,其成果发表在高影响力的期刊上,并获得了一些奖项。他还与大型银行、保险公司和电信公司以及各种科技初创公司进行合作。
第1章 数据科学伦理导读
1.1 数据科学(伦理)的兴起
1.2 为何关注数据伦理?
1.3 对错之分
1.4 数据科学
1.5 数据科学伦理平衡
1.6 数据科学伦理的 FAT 流程框架
1.7 本章总结
第2章 伦理数据的收集
2.1 隐私权属于人权
2.2 条例
2.3 隐私保护机制
2.4 警世故事:“后门”和信息加密
2.5 偏差 / 偏见
2.6 警世故事:路况检测、大猩猩和简历
2.7 人体实验
2.8 警世故事:约会、幸福和广告
2.9 本章总结
第3章 伦理数据预处理
3.1 定义和衡量隐私的标准
3.2 警世故事:再识别
3.3 定义和选择变量
3.4 警世故事:妊娠与人脸识别
3.5 公平的新定义
3.6 警世故事:偏见性语言
3.7 本章总结
第4章 伦理建模
4.1 隐私保护数据挖掘
4.2 歧视感知模型
4.3 警世故事:预测累犯和划红线
4.4 可理解的模型与可解释的人工智能
4.5 警世故事:解释网页分类
4.6 伦理偏好:自动驾驶汽车
4.7 本章总结
第5章 道德评价
5.1 道德衡量
5.2 结果的伦理解释
5.3 道德报告
5.4 德里克·斯塔佩尔的警世故事
5.5 本章总结
第6章 伦理部署
6.1 系统访问
6.2 预测差异性与结果差异性
6.3 警世故事:人脸识别
6.4 诚实和换脸技术
6.5 管理方式
6.6 非预期后果
6.7 本章总结
第7章 结论
致谢
参考文献