大数据正在影响人们的生活、改变生活方式,数据革命不可避免。作为剑桥大学大数据研究员和有着丰富数据行业从业经验的专家,萨姆·吉尔伯特认为大数据如果应用得当,受到政府的监管,将会服务生活,给人们带来意料之外的益处。这本书改变了读者对于数据、数字技术的悲观看法,透过繁杂的数据海洋,探索出一套大数据促进社会进步、影响个人决策的新方案。
本书是英国《金融时报》月度商业书籍,这本书改变了读者对于数据和数字技术的悲观看法。作者萨姆·吉尔伯特作为剑桥大学大数据研究员和有着丰富数据行业从业经验的专家,认为大数据如果应用得当,受到政府的监管,会使大数据服务生活,产生意料之外的好处。例如,在医疗领域,通过对大量已有病患的数据进行机器学习,能够帮助医生诊断患者是否患有某些特定的癌症。在食品配送行业,相关企业将海量数据进行分析,用于规划路线,与后勤和人工协作,为客户提供更高效的服务。作为普通人,我们可以有技巧地应对大数据,比如,利用大数据规划自己的出行决策等。总之,好的数据有助于社会进步和个人决策。
导论
2018年,39岁的我选择重新回到大学继续读书。雷(Ray)是我在网上找到的一位帮手,他帮我把我的一个手提箱和几箱子书装进他的货车后部,然后开车把我从伦敦送到剑桥。9月是学生搬家的繁忙日子,在旅途中,我们聊到了他那周接到的去往其他城市的订单南安普顿、曼彻斯特,以及再去一趟剑桥。我看到他的钥匙链上挂着德国牧羊犬的小挂件,所以问他是不是喜欢德国牧羊犬。他说没错,他有两只狗,分别叫萝拉和查理。雷说这两只狗都是搜救犬:萝拉五岁了,但仍和她是小狗时一样可爱;查理年纪更大、更警觉,在陌生人面前尤其如此。我们讨论了狗对人们的身体和情感健康的巨大影响。当雷问我在剑桥要学什么时,我告诉他我要学政治学。他在回应之前思考了一会儿,正当我脑海中迅速闪过英国脱欧、唐纳德·特朗普等议题以应对他可能的追问时,他却只说了一句:你确实选择了一个有趣的时机来做这件事。
当然,不是每个人对我回学校读书这件事的反应都像雷这样云淡风轻。在过去的6年里,我一直担任英国发展最快的科技公司之一的保贝美(Bought By Many)**保贝美(Bought By Many)是一家总部位于英国伦敦的宠物保险公司,公司中文名为译者所起。译者注的首席营销官。在递交辞职信后,我在领英(LinkedIn)上更新了自己的状态。没过多久,一位老同事联系我,问我要不要一起去喝杯咖啡。我欣然应邀,当然也在想万一他对我的学术研究感兴趣呢。我们约在克莱肯威尔(Clerkenwell)一家时尚且文艺的咖啡馆见面。嗯,服务员端来我们点的馥芮白咖啡后,他说道:我本以为你很智慧的,怎么现在作出这么荒唐的决定呢?他甚至认为我正在经历中年危机。当我独自一人在剑桥,擦拭着我学生公寓地下室厨房的抽屉时,我想我能理解一点这位老兄的惊诧了。
为什么我选择了这条确实令大多数人感到困惑的职业道路?我想我的决定来自2018年4月17日晚《卫报》(Guardian)的那次现场直播。当时我的生活一切都很顺利,但外面的世界似乎正在分崩离析。一段时间以来,自由民主之风每况愈下,右翼民粹主义者赢得了法国、荷兰、德国和奥地利的多数选票和议会席位。但世界上正在发生变化的情况远不止于此。我们这个世界似乎终于找到了英国脱欧、特朗普和其他一切看起来不令人愉快之事的罪魁祸首:脸书(Facebook后改名Meta),而自由民主经历的危机正是马克·扎克伯格所犯下的过错。
我们回到《卫报》的那次直播活动。那次活动的主题是剑桥分析公司里的一位告密者克里斯托弗·怀利(Christopher Wylie)和在那次直播中揭发丑闻的《观察家》记者卡罗尔·卡德瓦拉德(Carole Cadwalladr)之间的访谈。当时,我和我的老朋友吉姆一起坐在观众席里。吉姆和我在2008年他雇用我在益百利(Experian)数据公司工作时就认识了。我们一起合作,为数字营销人员开发益百利软件和数据产品,这个项目也包括对闪科(Techlightenment)的收购活动,而闪科是一家拥有一个运营大规模的脸书广告活动平台的初创公司。后来,吉姆跳槽去了DNA视觉(VisualDNA)掌管营销业务,DNA视觉是一家利用个人定制化调查问卷来精准推送在线广告的公司。我则去了保贝美,通过在脸书上收集数据,分析客户喜欢的狗和猫的品种,并向他们精准推送广告,以此拉来了数十万名新客户。当我坐在黑暗的礼堂里,听怀利讲述剑桥分析公司如何利用脸书数据为其政治关联的客户对普通人发动心理战时,我心里不由被蒙上一层阴云。我瞥了吉姆一眼,他的眼神中似乎流露出和我相同的困惑。见贤思齐焉,见不贤而内自省也。我们是不是也犯了同样的错?我们也是坏人吗?我有一种阴郁冰凉的感觉。
但随后我意识到演讲人正在让我失去与现实的联系。毫无疑问,怀利有他独特的魅力,机智而犀利的谈吐十分迷人。他穿着破洞牛仔裤,戴着大眼镜和鼻环,还有一头热辣粉红的头发,这很符合人们心中对数据矿工和电脑极客的刻板印象。因此我也很容易理解为什么卡德瓦拉德作为一名专栏作家认为这位怀利掌握的消息来源是有可信度的,以及为什么怀利能够吸引观众的注意力。他是一个优秀的故事讲述者,有一种用外行人能够理解的语言体系阐述数据分析这门复杂技术的天赋。但我从自己的专业经验中知道,他对脸书和定向投放数字广告技术所说的很多话都有误导性。更糟糕的是,其中一些内容是完全错误的。
在离开直播活动现场的时候,我们遇到了一位朋友,她和她的丈夫曾经经营一家医疗智库。他们对所听到的感到苦恼和愤怒。尽管他们是绿党**英国绿党的价值包括左派自由主义、普世价值和自由市场。译者注的活跃成员,但他们的愤怒无关政党政治,这场活动的话题实际上事关的是民主机制的完整性。脸书正在破坏民主的根基,而且一些事情已经发生了。我与他们对当代政治有相同的担忧,但我不同意推翻脸书就是我们想要的答案。我想解释怀利所讲的故事内容存在一些错误之处,以及为什么这么多有智慧和有思想的人被这些错误所迷惑是一件危险的事情。毕竟,我在数据分析和数字营销领域工作了18年自己也几乎被它洗脑。
尽管我当时想说,但我什么也没说我意识到我找不到合适的语言去表达。当时,我只说了一些只有我们这些数字市场营销人员内部才能听得明白的一些技术性行话。我本可以展开谈谈市场分割、潜在客户、网页浏览缓存(cookies)的运作机理以及相似客户群等,但这并不能更好地表达我的想法,更改变不了什么。我觉得我需要一种新的思路和话语体系与大家交流数据相关的议题,所以我选择辞掉了工作,回到大学进行学习。
***
在相对较短的时间内,一个极具影响力的理论已经发展出来,用来解释脸书等科技公司与过去几年的政治和社会动荡之间的明显联系。它关注数据的作用,被称为监视资本主义(surveillance capitalism)。该术语由哈佛商学院教授肖沙娜·祖波夫(Shoshana Zuboff)于2015年提出,正是她最近出版的700页的著作《监视资本主义时代》(The Age of Supervision Capitalism)将其推向了主流。许多其他对技术持批评观点的知名学者,包括泽奈普·图费克奇(Zeynep Tufekci)、希瓦·韦迪雅那桑(Siva Vaidhyanathan)和约翰·诺顿(John Nouton),也赞同这一观点。这是反对脸书的案例。
当你在脸书、照片墙(Instagram)或瓦茨艾普(WhatsApp)注册时,你会给脸书一些你的个人数据,这样你就可以创建个人资料并找到其他用户。这可能包括你的电话号码、出生日期、你上的学校、你最喜欢的音乐等等。当你继续使用脸书时,你的个人资料会得到来自其他数据的补充,比如与你建立联系的朋友、你加入的团体以及你关注的组织和公众人物。我们将这种数据称为个人画像数据(profile data)。脸书还收集有关你的行为数据,例如,你所喜欢或分享的新闻轶事、你取消静音播放状态观看的视频以及与你互动最频繁的那些朋友等等。另外,由于它还通过使用脸书账号登录等功能与其他网站建立集成关系,所以脸书还能够收集你在网上其他地方浏览的数据。我们称以上这类数据为行为数据(behavioral data)。
你的个人画像数据和你的行为数据将被脸书整合起来,这意味着你的信息会被投放到几乎无限数量的潜在受众中,然后广告商可以通过给脸书一笔钱来使用脸书的工具来进行广告的定向推送。例如,一家床垫公司可能想向年龄在29岁到45岁之间喜欢瑜伽的女性推销其新产品,脸书上的数据让这一切得以实现。如果你符合这一要求,那么你的推送中就会出现类似这样的一则广告:一位女性以莲花坐姿漂浮在床垫上方的图片。如果你不符合这一群体特征,它就不会向你推送。如果这家床垫公司是在传统媒体上做广告的话,那么它就只能在面向健康意识强的女性的杂志上,或者在大城市火车站的广告牌上做广告了。在传统方式下,看到广告的大多数人都不是广告公司想要的目标受众。
以这种方式收集和整理数据,让脸书的广告位比杂志和广告牌上的大多数广告位更具有价值。这是脸书盈利的重要部分。监视资本主义理论认为,这种商业模式本质不合法。这是一个相当强的结论。如果某件事情是不合法的,我们就不能支持它的存在这意味着它不仅是不公正的,而且实际上是不可容忍的。一个典型的非法性例子是一个武装团体通过政变夺取一个民主国家的控制权。监视资本主义理论认为,脸书对数据的使用也同样严重,有以下三个方面的原因。
第一,你并没有允许脸书以这种方式使用你的个人画像数据,你没有同意脸书这样做。当然,脸书的服务条款或其数据使用政策可能会提及数据使用方式这一点,但这些条款太长且难以被用户清晰理解。寄希望于用户认真将这些条款真正读完是不公平的,所以你点击接受来表达的任何同意都不能被视为是知情(informed)同意。
第二,行为数据的收集是隐蔽且具有侵犯性的,换句话说,它就相当于监视。因此,这是对隐私权的侵犯,相当于有人在你家里秘密拍摄你或窃听你的电话。同样,脸书条款和条件中无论怎么说都是无关紧要的,因为理解他们描述的技术过程超出了大多数脸书用户的能力。此外,如果你想拿回自己的个人画像数据和行为数据,还不想丢掉脸书所提供的服务,这几乎是不可能的。
第三,脸书的商业模式所创造的社会关系是掠夺性和剥夺性的。个人资料数据应视为您的数字财产,行为数据应视为您的数字劳动力的剩余。脸书从你身上拿走了这些,使你成为现代数字世界中的一个农奴,为一个残忍的封建主而劳碌。因此,脸书从数据中获得的权力是不合法的,因为它是通过一种如果理性的人意识到这些,他就不会同意的手段获得的。
网站上宣传克里斯托弗·怀利和卡罗尔·卡德瓦莱德访谈对话的图片直接来自科幻小说中的反乌托邦**反乌托邦:想象中地狱般的、一切都很糟糕的社会状态。译者注:两只巨手压在坐在电脑屏幕前的一排人身上(如下图所示)。下面这些人实际上是被操纵的两只巨手的每个手指的指尖与每个人的头部融合,使数据从设备中倾泻而出,就好像他们的生命之血从设备中流出一样。副标题写道:互联网已经被腐蚀成了权贵的宣传工具,这幅图也可以被称为行动中的监视资本主义。
萨姆·吉尔伯特:牛津大学历史、英语学士,剑桥大学政治学与国际关系硕士,剑桥大学贝内特公共政策研究所助理研究员,主要研究领域是科技与政治的互动。他也是数据驱动营销方面的专家,曾任多家公司高管。
目录
致谢... 1 ...
导论... 1 ...
第一部分妄想
1数据是新的石油?... 15 ...
2智力游戏... 35 ...
第二部分繁荣
3集体意识... 63 ...
4数据丰裕... 84 ...
5不只关于我们... 120 ...
第三部分权力
6接管全景监狱... 145 ...
7科技公司首席执行官的傲慢... 175 ...
第四部分政策建议
8数字合法性... 205 ...
9大型科技公司的数据道德... 229 ...
结论... 252 ...
图片来源... 258 ...