语义万维网所面临的一个重大问题,就是如何处理海量语义数据,它一直被认为是制约语义技术发展的瓶颈。本书系统地介绍了海量语义数据处理的最新技术和进展,通过介绍LarKC项目所开发的海量语义处理平台及其应用,来阐述海量语义数据处理技术的基本原理、实现方法和应用开发等一系列关键问题。《海量语义数据处理——平台技术与应用》由黄智生、钟宁著,全书共13章,分为上、下篇。上篇为技术篇,内容包括海量语义数据处理基本原理、海量语义数据处理平台体系结构、识别与选择技术、抽象与学习技术、推理与决策技术及LarKC平台应用开发技术等。下篇为应用篇,内容涉及LarKC平台开发的一系列应用系统,包括关联生命数据集、基于语义技术的医学文献检索、语义技术在生命科学中的应用、语义技术与城市计算以及语义技术在智能交通中的应用等。《海量语义数据处理--平台技术与应用》不仅是一本介绍海量语义数据处理LarKC平台及其技术与应用的参考书,同时对语义数据处理技术问题的研究人员、语义数据处理平台实现的技术人员以及语义技术的应用开发人员均具有一定的参考价值。
语义网所面临的一个重大问题就是如何处理海量语义数据,它一直被认为是制约语义技术发展的瓶颈问题。在这样一个技术背景下,欧盟第七研究框架开展了语义网LarKC重大项目的研究。其研究目标在于开发海量语义数据处理平台,并通过一系列应用开发为海量语义数据处理的技术研究提供科学实验证据。经过三年多的努力,LarKC项目在海量语义数据技术方面取得了一系列重大进展。《海量语义数据处理——平台技术与应用》由黄智生、钟宁著,系统地介绍了海量语义数据处理的最新技术和进展,特别是通过介绍LarKC项目所开发的海量语义处理平台及其应用,来阐述海量语义数据处理技术的基本原理、实现方法和应用开发等一系列关键问题。
北京市特聘专家(海聚工程特聘教授),北京工业大学国际WlC研究院学术带头人。日本东京大学博士,日本前桥工业大学研究生院及生命信息系教授,国际学术组织WebIntelligence Coortium(WlC)主席,国际学术期刊Web Intelligence andAgentSystems主编,IEEE计算智能学会脑信息学任务组主席。 黄智生(Zhisheng Huang)荷兰阿姆斯特丹自由大学计算机系高级研究员,北京工业大学国际WIC研究院等多个大学兼职教授。主持欧盟第七研究框架重大语义技术研究项目LarKC中的推理工作组的研究。在国际期刊和会议上发表、交流学术论文百余篇。担任近七十个国际学术会议组织委员会或程序委员会的委员或联合主席。
第1章 导论 1.1 语义技术概述 1.2 海量语义数据处理 1.3 LarKC概述 1.3.1.LarKC项目 1.3.2 LarKC技术概述 1.3.3 LarKC海量语义数据处理平 第1章 导论 1.1 语义技术概述 1.2 海量语义数据处理 1.3 LarKC概述 1.3.1.LarKC项目 1.3.2 LarKC技术概述 1.3.3 LarKC海量语义数据处理平台概述 1.3.4 LarKC应用技术开发概述 1.4 本章小结 参考文献第一部分 技术篇 第2章 LarKC海量语义数据处理平台 2.1 LarKC体系结构 2.2 LarKC平台的安装与使用 2.2.1 获取LarKC 2.2.2 运行LarKC 2.2.3 一个简单工作流实例 2.3 工作流设计器 2.3.1 工作流设计器概览 2.3.2 安装及主要操作 2.4 LarKC插件概述 2.5 用户支持和版权信息 2.6 本章小结 参考文献 第3章 识别与选择 3.1 识别方法与识别插件 3.2 基于兴趣的选择方法与插件实现 3.2.1 基本原理与基本算法 3.2.2 方法的可扩展性与效率比较 3.2.3 基于兴趣的选择插件设计与实现 3.3 随机索引选择方法与插件实现 3.3.1 语义索引 3.3.2 基于随机索引与Lcene索引的检索比较 3.4 选择方法与选择插件的应用 3.4.1 基于兴趣的选择插件应用示例 3.4.2 随机索引选择插件应用示例 3.5 本章小结 附录 第3.3.2 节相关询问 参考文献 第4章 抽象与转换 4.1 机器学习 4.1.1 SUNS 4.1.2 机器学习插件 4.2 数据流 4.2.1 C-SPARQL 4.2.2 数据流插件 4.3 归纳与演绎结合的数据流推理 4.3.1 动机 4.3.2 数据流推理的结构框架 4.4 本章小结 参考文献 第5章 推理与决策 5.1 LarKC推理与决策插件 5.2 常规语义推理 5.2.1 OWLAPI推理机 5.2.2 SPARQLDL推理机 5.3 并行与分布式推理 5.3.1 采用MapReduce技术的海量分布性推理 5.3.2 采用WebPIE进行OWL分布性推理 5.4 基于规则的推理 5.5 本章小结 参考文献 第6章 非常规语义推理 6.1 不一致本体的推理 6.1.1 语义网与不一致性 6.1.2 基本方法 6.1.3 LarKC平台下的PION系统 6.2 转折推理 6.2.1 基本定义 6.2.2 计算方法和实现 6.2.3 转折推理插件 6.3 嘈杂语义数据的推理 6.3.1 基本定义 6.3.2 韩国首尔RSM系统示例 6.4 本章小结 参考文献 第7章 LarKC系统与应用开发 7.1 LarKC工作流开发 7.1.1 工作流图 7.1.2 工作流描述 7.1.3 更复杂的一个示例 7.2 LarKC插件开发 7.2.1 LarKCMaven原型的使用 7.2.2 插件代码编写 7.2.3 整合插件到LarKC平台 7.3 相关的开发工具 7.3.1 集成开发环境Eclipse 7.3.2 项目管理Maven 7.3.3 单元测试JUnit 7.3.4 版本控制SVN 7.4 本章小结 附录 复杂的工作流描述示例 参考文献第二部分 应用篇 第8章 关联生命数据集 8.1 概况 8.2 关联生命数据组成 8.3 语义关联构造 8.4 关联生命数据集的使用 8.4.1 关联生命数据集关键词查询 8.4.2 关联生命数据集SPARQL语义查询 8.5 本章小结 参考文献 第9章 生物医学文献语义检索 9.1 需求分析 9.2 通过LLD进行医学文献检索 9.3 医学文献语义标注 9.4 LarKC医学文献语义检索插件 9.5 本章小结 参考文献 第10章 海量语义数据处理与基因研究 10.1 概述 10.2 基因研究与语义数据 10.3 LarKC海量语义数据处理平台用于GWAS研究 10.3.1 LarKC的GWAS插件 10.3.2 关键词扩展推理器 10.3.3 GWAS识别器 10.3.4 GWAS工作流 10.4 本章小结 参考文献 第11章 城市计算Ⅰ:交通与社交媒体 11.1 交通路线规划 11.1.1 框架结构 11.1.2 交通预测 11.1.3 语义交通路线规划 11.1.4 评价 11.1.5 小结 11.2 社交媒体分析 11.2.1 概况 11.2.2 框架结构 11.2.3 BOTTARI的LarKC工作流 11.3 本章小结 参考文献 第12章 城市计算Ⅱ:路标管理 12.1 基本思想 12.2 RSM数据集与数据整合 12.2.1 RSM数据集 12.2.2 数据整合 12.2.3 路标的有效性审核 12.3 RSM语义数据处理 12.3.1 系统结构 12.3.2.RSM工作流 12.3.3 :RSM查询与推理 12.4 RSM系统用户界面 12.5 本章小结 参考文献 第13章 海量语义数据处理技术展望 13.1 市场分析 13.1.1 语义技术的市场观察和潜力 13.1.2 市场分析的结论 13.2 LarKC海量语义数据平台应用展望 13.2.1 药物研发海量语义数据处理 13.2.2 语义技术用于政治文化分析 13.2.3 智能交通系统 13.2.4 基于语义技术的电子病历 13.3 海量语义数据处理研究展望 13.4 结束语 参考文献