从量数、据数、普适记录、人脸识别、以图搜车,到雾计算、城市大脑、单粒度治理、无匿名社会、量子思维……作为中国研究大数据的权威专家,作者在《数文明》一书中,以大数据为核心元素,抽丝剥茧,深入地阐述了这个大数据时代的文明社会一个全新的数文明时代。
将大数据与人类文明融合在一起,这本书提供给我们的不仅是一种全新的叙事结构,它还将突破你的认知边界和思维极限,给你提供一个应对这个世界的全新的认知方法论。
《数文明》一书从三个层面鞭辟入里地描绘了互联网时代的一种全新文明形态:人类的数据文明它将是互联网的下半场;商业世界的数据文明商业世界将迎来重塑和再造;以及个人世界的数据文明我们该如何从不完整的个体跨跃到高能个体。不论在哪个层面,数文明对人类的颠覆和重构都将是影响深远的。
可以说,《数文明》重构的不仅仅是我们的认知逻辑,还有身处这个数文明时代的生存逻辑不仅包括每一个国家、每一种社会、每一家企业,还有每一个个体。
1. 大数据先锋思想家、阿里巴巴集团前副总裁、《大数据》《数据之巅》作者涂子沛,再攀数据高峰,预览人类数文明。林毅夫、孟庆国作序,罗振宇、吴晓波、万维钢、田溯宁、毛光烈、吴甘沙联袂推荐!
2. 从互联网、物联网到数联网,大数据催生的商业应用在不断更新迭代;
从人工智能、城市大脑到单粒度治理,大数据在推动国家治理现代化;
从量数到据数,从德治、法治到数治,大数据2.0时代已经到来;
数文明是理解过去与现在的一条捷径,是连接历史与未来的文明金线。
3. 通常有关前沿科技思想的书都是美国人写给美国人的这本是中国人写给中国人的。书中有先进的思想和鲜明的中国素材。涂子沛不但有高超的研究水平和一手的亲身经历,而且他掌握了科学写作的艺术:书中每一页都能引人入胜。
万维钢,科学作家,得到App《精英日课》专栏作者
前言 从幼稚到成熟:我们这个时代的数据革命
一个新的数据划分方法
随着大数据的兴起,言必称数据逐渐成了我们这个时代一个显著的特征,但问题是,此数据非彼数据。
今天,所有记录的结果,甚至包括文字,都被统称为数据。这其中暗含的逻辑是,数据作为一个概念,它的内涵扩大了。传统意义上的数据是人类对事物进行测量的结果,是作为量而存在的数据,可以称为量数;今天的照片、视频、音频不是源于测量而是源于对周围环境的记录,是作为一种证据、根据而存在的,可以称为据数。
量数和据数,两者原本风马牛不相及,但在今天这个时代,它们又有了一个共同的特点以比特为单位进行存储。关于大数据的定义,我主张用这样一个等式较为简洁地表示:
大数据 = 传统的量数 现代的据数
(量数源于测量,如气温28℃)
(据数源于记录,如一张照片)
量数虽然比据数更接近数,但从历史上看,据数的出现要早于量数。人类早期对自身活动的记录,即史,就是早期的据数,也可以说,据数是历史的影子。量数则是在记录的实践中慢慢产生的,特别是针对天空、星体、山川等外物的记录,它们追求精确,于是我们逐渐延伸出测量的工具和行为。一切科学都源于测量,量数是否充沛,决定了科学的种子何时萌芽,决定了科学是否发达,也可以说,量数是科学的母亲,其核心要义是精确。
在16世纪前后,人类开启了大航海时代,量数出现了一个高峰。随着航海仪器的普及,欧洲对土地测量、建筑设计、矿山开采、人口统计的需求也应运而生。人类发现,定性描述不足以解决问题,只有更加精确的测量和计算,才能够满足科学和管理的需要,这引发了历史上第一次数据爆炸:量数爆炸。
这也是人类历史上第一个数据的春天。
进入20世纪后,由于计算机、互联网和智能手机的普及,据数开始爆炸,相较于16世纪的量数爆炸,据数爆炸的规模更大。今天大数据的主体,从体量上来看,毫无疑问是据数,即对人类活动及周边环境越来越多的记录,或称普适记录。互联网平台记录的,大部分是据数。
和今天的普适记录相比,过去5 000年的文明看似浩如烟海,但其实相当有限,史书虽然一本比一本厚,但大部分都聚焦在为数不多的帝王将相身上,关于普通百姓的个体性记录,在全世界各个国家都少之又少。随着普适记录的兴起,这种情况正在迅速改变,未来不仅有国家史、社会史、行业史,还会有数量惊人的个人史。可供历史学家研究的资料,将会像雪球一样越滚越大,其规模将前所未有。
量数对于中国的巨大意义,自不待言,黄仁宇的数目字管理在20世纪曾经开启过一场讨论,我的前两本书《大数据》《数据之巅》关注的是量数,尤其是《数据之巅》,它延续了黄先生的讨论,而本书更侧重据数。
一场还没有完成的革命
今天的大数据之热,热的其实是据数,和精确的量数几乎没有任何关系。
据数之热并不奇怪,它源于互联网带来的变革和它已经展现出来的巨大的财富效应,形形色色的手机应用给了每一个人更加直观的感受,不管是电商、社交还是自媒体,哪一个不是跟记录之据数有关呢?
几乎人类的一切行为,今天都可能、可以被记录,并被转化为据数。如果说量数的核心要义是精确,那据数的关键就在于清晰地留据。
因为智能手机的普及,据数已经无处不在,但我们大部分人对据数的理解是肤浅的,迄今为止,以据数为中心的大数据讨论主要停留在以下三个层面。
一是精准营销,即互联网广告业。和传统的广告业相比,今天的互联网和智能手机通过记录消费者不断产生的数据,可以向终端用户推送个性化的广告,这大大提高了行业效率。这是大数据革命在商业领域的起源。这也是目前互联网企业,无论是中国的BAT(百度、阿里巴巴、腾讯),还是美国的谷歌、Facebook(脸谱网)、亚马逊主要的赢利途径。
二是商业和社会信用,其主体是金融机构。除了精准营销,这是利用大数据赚钱的第二个法门,也是我们看到诸多互联网企业陆续进入金融领域的原因。其商业模式是,通过消费者的消费记录评估消费者的信用,从后续的金融服务中赢利。例如阿里巴巴旗下的芝麻信用和腾讯旗下的微粒贷,它们在给消费者打信用分的基础上,向单个消费者提供贷款等金融服务。
这两种商业模式,都需要通过数据监控消费者在互联网上的一举一动,消费者个体因此成为被观察、被分析、被监测的对象,这就带出了第三个层面的问题隐私。这两种商业模式的副作用是,我们几乎每天都能听到数据泄露的新闻,时不时还会看到因为它而导致的悲剧。
最近,我的一个朋友告诉我,今日头条向他推送泳衣和泳镜的广告,明显是知道他最近去游泳了,他琢磨了一下,发现唯一可能的原因,是他在下水之前把智能手表调节到了泳池模式。
毫无疑问,今日头条打通了这款智能手表的数据。大众对这种商业模式有一种矛盾的心理:一方面,我们感到权利受到了侵犯,没有得到尊重,被出卖了,社会舆论也往往会把它简单地放在公平的背景下进行考量,一边倒地反对这种商业模式;另一方面,也许我们真的需要一副泳镜,不想拒绝这种便利和高效。
这两种商业模式之所以可行,是因为它们以据数为基础掌握了消费者的动态,据数的商业和管理价值正是本书论述的重点,但为了行文方便,本书大部分时候仍使用了数据一词,因此本书的数据二字实为指代据数一义。
这就是大众眼中的大数据,前两者为商业利润而生,而隐私问题屡屡成为社会公共话题。可是,这三个层面仅仅揭开了冰山的一角,难道大数据就是养了几家大公司,方便了公众生活,改善了信用评级体系,让生活更美好或者多了点麻烦这么简单?
我认为远不止于此。
在商业层面,大数据还在进一步深化变革,它所催生的互联网应用仍在不断更新迭代。当大数据完全发挥出它的潜力时,其形态将是全自动商业,或称智能商业,商业文明将会被重塑和再造,本书将对此进行阐述。
据数的商业化应用带动了大数据的兴起,但商业只是故事的一个边角,革命是社会化的,未来我们还会看到智能制造业,它所依靠的还是数据,数据引发的变化还在向社会治理和个人生活领域全面拓进,它涉及社会生活的方方面面,将会推动整个社会进入文明新状态,改变社会的全貌。一个新的故事正在世界范围内浮现。我们必须抛开细枝末节,看到那些更深刻的、方向性的东西。数据的力量正在重塑整个社会甚至人类的天性。
我称之为数文明,这是本书的主题。
推荐序一 / 林毅夫 // V
推荐序二 / 孟庆国 // VII
前言 从幼稚到成熟:我们这个时代的数据革命 // IX
1. 数据平权:新商业文明的冲击和原罪 //
001
心理入侵:大数据读心术诞生了 // 004
价格操控:大数据杀熟和算法合谋 // 013
数惧的最深层:人工智能三宗罪 // 020
新经济到底新在哪里:智能商业 // 027
金矿如何形成:个人数据的价值困境 // 031
数权:互联网原罪浮出水面 // 037
2. 无匿名追踪:
天网的隐喻 // 045
要是此案在中国,早破了 // 048
三体:天网的真正维度 // 053
互联网要向天网学习什么 // 058
雾计算:人工智能的竞技主场 // 063
以图搜车:追踪亿万车辆之轨迹 // 066
硬盘和眼药水为什么同时脱销 // 072
3. 人脸和人工智能 // 083
照片开路:构建身份社会 // 086
起步硅谷:几何时代的徘徊 // 089
机器能否学习:人工智能之争 // 093
不明觉厉:深度学习的崛起 // 097
数据田径场:政府怎样推动商业创新 // 107
历史的意外:9·11事件如何拯救失败 // 111
无匿名社会:动态识别的前景 // 115
4.高清晰社会:单粒度治理和笼中人险境 //
123
数纹:迈入高清晰社会 // 126
模糊社会的困境 // 132
超级档案的产生:单粒度治理 // 136
抑制侥幸:中国古代的治国经验 // 144
高能个体:人人皆持剑,又皆为剑下人 // 148
数据即证据:无侥幸天下 // 151
5. 数力:普适记录如何掰弯人性 //
161
唐宗宋祖的烦恼 // 165
爱迪生拓宽记录的疆域 // 172
尼克松之困:白宫录音小史 // 176
特朗普的录音风波 // 183
视频直播为什么低效 // 187
普适记录:上帝的终极武器 // 189
6. 数文明:社会、商业和个人如何被记录赋能
// 199
一个新的发展视角:记录 // 202
历史上中国文明领跑与掉队的原因 // 207
三本书在三个大陆的三种命运 // 213
十计九记:商业文明的进步密码 // 219
电梯里的羞辱 // 225
全面记录全面计算:开创数文明时代 // 229
7. 数据新政:建设现代国家的治理体系 //
239
数基:世界级创新和本土难题 // 241
数联网:数据维度上的整体性政府 // 248
城市大脑:新时代的南京长江大桥 // 256
仅此一次:最多跑一次如何升级 // 262
开放摄像头:天网的未来 // 266
对数据和算法的现代治理 // 273
8. 人工智能的边界、风险和未来 // 281
一切皆可预测:拉普拉斯之妖 // 284
量子思维:不确定的现实 // 287
人是城市中的粒子:测不准 // 290
数据相对论:普适记录的极限 // 294
表情分析:人工智能的边界 // 300
转型智能社会:怀揣瓷器花瓶,进入花花世界 // 310
结 语 第四次浪潮:我们如何再次领先 // 319
后 记 野路无人自还 // 329
大事记 // 335
索 引 // 343