本书以大数据时代的海量文献使用数据为研究基础,在对既有的以替代计量指标(Altmetrics)和使用计量指标(Usage Metrics)研究为重点的文献计量学研究成果及相关动机理论研究成果进行梳理总结的基础上,采用问卷访谈调研与模型构建相结合的方式,对以科研人员为主的用户的文献使用动机、使用模式等进行全面研究,并在此基础上利用中国知网的部分文献使用数据和来自施普林格图书(Springer Book)等平台的全球用户文献使用数据,分别对期刊论文和电子书两者的文献使用模式进行分析,对利用文献使用数据辅助图书馆实践工作的两个相关案例进行深入剖析,以期为我国进一步建立健全学术成果多维评价机制,助力科技强国建设,以及图书馆文献资源保障服务的提质增效提供参考。
文献使用数据作为科学文献大数据中的一个重要类别,是对传统引文数据的补充,一定程度上反映了科研活动及科研成果在不同方面的受关注程度。它的存在,也为当代科学学和科学计量学研究开辟了诸多全新的研究领域,回答了诸多传统文献数据类型所无法触及的新问题,如科研工作者是否全年无休地在进行研究,科研工作者当下正在研究什么内容。这些问题的回答都是基于海量的文献使用行为。由于单个用户的文献使用行为夹杂了诸多随机性和个体倾向性,那么由海量单个用户的文献使用行为记录所汇集成的文献使用数据能否(或在多大程度上能够)反映科研成果的影响力?或者说,海量的充满不确定性的个人使用行为数据能否涌现为可预测的文献使用模式?在未对用户的文献使用动机进行调查的前提下,我们难以准确回答这一问题。本书的缘起正是基于对这一问题的探索。然而,在对文献使用数据和文献使用动机探索的过程中,笔者进一步发现分析文献使用数据对于人们理解科研工作者的科研活动规律、科研发展趋势等具有极大的价值,其应用不应局限在影响力评价这一狭小空间内。跳出影响力评价,文献使用计量有着更广泛的应用空间。
本书以科学大数据环境下用户的文献使用行为作为核心研究主题,聚焦用户的使用动机这一关键驱动因素,采用数据模型数据这一大数据时代新型研究范式,在厘清文献使用行为和动机基本理论问题的基础上,先利用调查问卷数据构建文献使用动机模型,再利用文献使用数据对模型进行验证,最后将成果用于指导实践,从而实现对文献使用动机的理论研究、模型构建和实践应用研究。具体来说,本书的前2章回顾了现有的文献使用计量和动机理论两方面的研究成果(亦即本书的理论铺垫),并指出现有研究的不足之处。第3章对本书所涉及的文献使用行为的主体和客体进行界定,并介绍本书所研究的文献使用行为的概念边界,包括文献使用方式、文献使用流程、文献使用工具以及由此产生的常用文献使用计量指标等。第4章在此基础上,通过半结构化访谈和在线问卷调查,获取了不同群体的文献使用动机及文献使用行为特征。第5章利用改进的技术接受模型(TAM)构建了文献使用动机模型,并在第6章对此进行深入剖析。第7章分析由不同文献使用动机汇集成的不同文献使用模式,并利用大样本数据对模型中的结论进行了验证。第8章探索如何将前述研究成果运用于图书馆工作实践,如助力科研成果影响力多维评价、提高文献资源保障服务质量等,并在第9章的结论中提出部分针对性建议。
本书的创新之处主要体现在以下几个方面。
首先,从文献使用计量指标回归文献使用动机这一根源性问题。已有的关于替代计量指标(Altmetrics)和使用计量指标(Usage Metrics)的相关研究主要聚焦于不同指标间的相关性、特定指标时空变化特征等表层属性计量,未对用户内在的使用动机进行深入分析,因此学界对于指标的科学性及可靠性存在一定的争议,对于如何合理利用相关指标进行实践也缺乏成功的范例和相关的指引。本书首次通过用户文献使用动机研究,通过半结构化访谈、问卷调查、模型建构等方式得出了一些有益的结论。例如,确定了多数用户使用文献的行为主要是基于学术动机;文献使用数据反映了文献内容对于使用主体的价值;不同文献使用行为发生在主体科学活动的不同阶段,其价值内涵也存在一定的差异;文献作者的社会网络复杂度可能影响主体对于文献的使用;文献使用指标不能反映文献的学术质量,但能在一定程度上反映文献的影响力。
第二,聚焦于文献使用环节中最为关键的下载行为。由于文献使用行为多种多样,全面研究各种文献使用行为动机存在难度,考虑到下载是使用电子文献过程中最常见和最重要的步骤,因此本书在模型构建环节中聚焦于文献下载行为,对文献的下载动机、下载模式、下载计量应用展开了全面分析,相关方法和结论亦可推导至其他文献使用行为的研究。
第三,引入技术接受模型(TAM)构建文献使用动机模型。电子文献使用行为从本质上来说是一种互联网使用行为,因此本书借鉴了互联网使用动机研究中常用的技术接受模型进行文献使用动机模型的构建。模型将用户使用文献的动机概括为感知有用性、感知易用性、感知有趣性、感知相关性4种因素,并分析了4种因素与文献使用频率之间的因果关系,证实了模型在电子文献使用情境下的适用性。将多样化的使用动机概括成4种关键因素,方便了后续的理论探索和实践应用。
第四,不仅进行了理论研究,更实现了研究成果的落地实践。在建立文献使用动机模型后,笔者并不止步于此,不仅思考并探讨了本书所依托课题申请之初拟探索的文献使用计量指标运用于影响力评价的可行性,而且进一步思考如何利用得出的模型指导图书馆服务创新。例如,在用于图书馆文献资源建设方面,探索如何从使用量而不是被引量出发提高高校图书馆的文献资源保障率;在用于阅读推广服务方面,探索如何更好地将图书馆资源推荐给读者使用等。以上皆有利于将研究成果的适用范围进一步扩大。
基于上述研究内容,笔者建议,对于文献使用数据的应用,应该跳出评价,运用到更加广泛的信息服务和科学决策中去,如图书馆的资源建设、学科服务、阅读推广服务等。对于政策制定者,也应充分认识到文献使用量指标所能反映出的内在含义及其局限性,以便更科学、合理地利用文献使用量指标,同时树立文献多维度价值导向,鼓励科研工作者将科研成果运用于知识普及、大众教育、生产实践等环节。
本书在撰写过程中得到了华东师范大学经济与管理学院的段宇锋教授、楼雯副教授,复旦大学的赵星教授,华东师范大学图书馆的周健副馆长及杨莉、彭霞等老师的大力支持和帮助,在此深表感谢。同时,我也想感谢帮忙填写调查问卷的各位老师和同学。此外,最重要的是要感谢我的妻子和女儿的支持。本书构思于女儿出生时,到完成时女儿已5岁,其间我还完成了博士论文的撰写,能坚持下来,离不开妻子的支持和鼓励以及女儿给予我的动力。本书还参考了近年来国内外替代计量学、行为动机学等领域的最新成果,因篇幅所限,在此不再一一列举,谨向相关专家和学者致以谢意。
本书的出版得到上海市哲学社会科学规划课题青年课题项目科学大数据背景下学术文献的使用动机研究(项目编号2019ETQ004)的资助。
由于笔者水平有限,书中难免存在疏漏和不足,敬请各位专家和读者批评指正。