《大规模场景图像的情感语义分析若干关键技术研究》内容简介:本书围绕场景图像的情感语义理解展开研究,从情感语义数据的获取、自动标注、情感语义类别的预测及大规模场景图像数据的高效检索等方面进行了探讨和研究,系统地阐述了场景图像情感语义分析的关键技术。从理论上,对场景图像蕴含的情感语义进行了抽象、分析和形式化表示;在实践上,搭建了实验平台进行了验证和分析,为各类图像数据的情感语义理解提供了新的思路和途径。全书集理论、技术、方法及实践于一体,具有较强的理论性和实践性,反映了当前该理论的第一新研究成果。
前言
随着多媒体技术、互联网技术及社交网络的迅速发展,人们可以访问的信息资源空前丰富。图像数据因其形象直观、蕴含信息综合性强等特点,应用领域逐渐增多,其数量更是以惊人的速度增长。但图像数据本身结构的复杂性、蕴含信息的多样性及时空的多维性导致如何有效组织和管理大规模图像数据、快速检索用户需求的图像成为学术界的研究热点。为此,图像的情感语义分析和检索技术应运而生,它综合人工智能、计算机视觉、模式识别、心理学及数据库管理等领域的相关知识,对图像数据蕴含的高层情感语义进行分析,旨在获得图像蕴含的内在情感语义信息,建立实用性强的图像检索系统。因此,对图像进行情感语义分析和高效检索技术的研究有着广阔的应用前景和实用价值。
本书以场景图像为研究对象,对SUN Database中的各类场景图像进行有针对性的情感语义分析和检索方法研究。从建立开学行为学实验环境下的场景图像情感语义数据获取平台开始,选择并改进了OCC情感模型,分析了场景图像语义理解方面存在的语义模糊性问题,采用粒子群(PSO)算法优化BP神经网络的权值和阈值,并由Adaboost算法组合15个BP神经
网络的输出结果,构建强预测器,对场景图像的情感语义类别进行预测,搭建了适合大数据处理的基于MapReduce并行编程模型的场景图像检索平台,系统地研究了场景图像的情感语义分析和检索方法。
全书共分为七章:第1章是绪论,介绍了场景图像情感语义分析的研究现状和本书的研究内容、组织结构;第2章介绍了大数据处理与图像检索之间的关系;第3章探讨了开放行为学实验环境下的场景图像情感语义分析方法;第4章研究了基于模糊理论的场景图像情感语义标注方法;第5章对基于Adaboost-PSO-BP神经网络的场景图像情感语义类别预测算法进
行了探讨;第6章研究了基于MapReduce并行编程模型的大规模场景图像检索技术;第7章对本书的研究工作进行了总结和展望。
曹建芳,教授。1999年7月毕业于太原理工大学计算机科学与技术系,2005年7月获山西大学计算机应用技术硕士学位,2015年7月获太原理工大学计算机科学与技术博士学位,主要研究领域为数字图像的语义理解。主持山西省自然科学基金一项(No.2013011017-2),山西省高校科技创新项目一项(No.2013150),并主要参与了一项国家自然科学基金项目(No.61202163)的研究。现已发表学术论文30余篇,其中SCI、EI两大检索计17篇。