书分为两大部分,包括炎症性肠病标准数据集和核心数据集。标准数据集共17大板块,包括患者人口学信息、就诊记录、现病史、既往史、个人史、家族史、体格检查、诊断信息、实验室检查、内镜检查、超声检查、影像学检查、病理及免疫组化、药物治疗、手术治疗、随访、样本库,所列举的数据元按数据元特点列举子模块、数据元名称、值域/数据类型、数据加工类型等内容。核心数据集部分为标准数据集中的一部分,占标准数据集中约四分之一的数据元,是作者归类的标准数据集中的核心内容,展示方式与标准数据集相同。
该书面向全体医务工作者,尤其是研究炎症性肠病和医疗大数据的临床医生及科研工作者。
前言炎症性肠病(inflammatory bowel disease,IBD)是一类原因未明的慢性消化道炎症性疾病,包括溃疡性结肠炎(ulcerativecolitis,UC)及克罗恩病(Crohn disease,CD)。IBD 多发于青壮年,病情迁延不愈,并发症发生率高,严重影响患者的生活质量。IBD 已经成为工业化国家消化系统常见病。在过去的20 年中,IBD 发病率在包括我国在内的新兴工业化国家快速上升。据2014 年中国疾病预防控制中心的数据,中国2005—2014 年间IBD 总病例约为35 万例。据估计,到2025 年,中国的IBD 患者将达到150 万人。由于IBD 病程长、病情复杂、易误诊误治,诊疗往往需要中心化,患者也需要长期随访。近年来,治疗IBD 的各类新药不断涌现,需要进行临床验证。为了提高IBD 疾病的诊疗水平,加快临床科研成果转化,建立标准化IBD 数据库是必由之路。
随着信息技术的高速发展,医疗大数据和人工智能已在许多疾病的诊断和治疗中发挥重要作用,帮助临床医师总结经验,提升疾病的诊治水平,达到精准治疗的目的,赋能临床、科研、教学等多个环节。但目前全国医院信息化建设标准与规范的落实尚处于起步阶段,不同医院、不同承建商信息系统的数据结构和标准存在较大差异,数据交互、整合、共享存在较大困难。由于IBD 的致病因素和发病机制复杂、资料获取途径广泛且分散,高价值IBD 数据资源的可及性、整合性、采集便捷性仍有待提升。针对IBD的疾病特点,建立规范且统一的标准基础数据集、标准核心数据集,打破数据壁垒,形成长期、连续、动态、多源、大规模的专病数据积累,促进丰富的临床病例资源向宝贵的医学研究资源转化,具有重要的临床意义。
中华医学会消化病学分会根据IBD 的疾病特点,组织中山大学附属第一医院、中山大学附属第六医院、中国医学科学院北京协和医院及浙江大学医学院附属邵逸夫医院等国内开展IBD 临床诊疗与研究比较成熟的中心,共同编写了基于行业指南、专家共识、术语规范的IBD 标准数据集。通过嘉和海森大数据科研平台标准建设,将分散于院内不同信息系统的临床诊疗数据通过信息采集、清洗、存储、整合等步骤集成云端数据中心,利用自然语言归一、结构化处理、患者主索引(enterprise master patientindex,EMPI)等先进的机器学习和人工智能技术,对信息数据以患者为维度进行规范集成、深度挖掘、多场景应用;同时,也支持将不同联盟医院的数据资源,通过多中心专病库数据共享平台进行连接交互,为后续基于真实世界大数据的多中心研究提供数据和技术基础,推动IBD 数据标准化建设,为我国IBD 的临床规范化诊疗与多中心研究打下坚实基础。
我们组织编写《炎症性肠病标准数据集(2021 版)》,以供国内同行参考,也希望大家在使用过程中不断发现本数据集的不足,及时向我们反馈。我们将在今后工作中不断完善本数据集,为我国IBD 的数据库建设及临床研究尽微薄之力。
陈旻湖
中山大学附属第一医院消化内科教授
中华医学会消化病学分会主任委员
2021 年3 月9 日