本书展示了如何运用数学资源中的图论来理解复杂对数线性模型表明的关联结构。作者首先回顾了二向与多向列联表的关系模式,以及这些表的对数线性模型。在介绍了图论中的一些关键概念后,作者紧接着将这些思想应用到对数线性模型的两个图形典型中:关联图和生成多重图。利用丰富示例以及清晰解释,作者展示了对数线性模型的两个图形典型如何说明模型的结构,揭示了他们的一些特征,如条件性独立、可分解性、可压缩性等。
对数线性模型于20世纪60年代末期至70年代早期得以发展并流行。包括对数线性模型在内的分类数据分析的课程目前是社会科学专业研究生教育的一项重要内容。全书结合大量示例,清晰展示了如何运用图论理解复杂对数线性模型表明的关联结构。本书描述的图论有助于构想和解释多向列表中的复杂对数线性模型。对于想要深入理解对数线性模型结构的学生和在研究中应用这些模型的研究者,这一专著都是有价值的。
对数线性模型(LLM)在利奥?古德曼(Leo Goodman) 等人的努力下,于20世纪60年代末期至70年代初得以发展并流行,而毕晓普(Bishop )、费恩伯格(Fienberg )和霍兰(Holland)于1975年写的《离散多元分析 》一书堪称该模型发展和推广中的一个里程碑,它对多向列联表(multi-way contingency tables)的分析产生了革命性的作用。包括LLM在内的分类数据分析的课程目前是社会科学专业研究生教育的一个重要内容。哈里?哈米斯的专著《对数线性模型的关联图和多重图》展示了如何动用数学资源中的图论来理解复杂LLM表明的关联结构。
哈米斯回顾了二向与多向列联表的关系模式,以及这些表的LLM。在介绍了图论中的一些关键概念之后,他紧接着将这些思想应用到LLM的两个图形典型中:关联图和生成多重图。在更为直观并且广为人知的关联表中,顶点(点)代表列联表中的变量,边(线)对应于模型中的关联项。相反,在多重图中,顶点代表一个分级LLM中的高阶关联项(生成因子),边对应由成对生成因子共享的变量。
利用经过精挑细选的丰富示例以及清晰的解释,哈米斯展示了LLM的这两个图形典型如何说明模型的结构,揭示了它们的一些特征,如条件独立性(比如说,变量A
和变量B在变量C的分类中是独立的), 可分解性(比如说,模型中的A,
B和C联合单元格的概率是AB边际概率和C边际概率的乘积),以及可压缩性(比如说,A和B的边际关联与A
和B在C的分类中的关联是一致的)。总的来讲,这一专著中描述的图论有助于构想和解释多向列表中的复杂LLMs。对于想要深入理解LLMs结构的学生和在研究中应用这些模型的研究者,这一专著都是有价值的。
编辑注释:这一专著是在前一任丛书编辑廖福挺的指导下开始着手的。
约翰福克斯
丛书编辑
哈里J.哈米斯(Harry J.
Khamis),俄亥俄州代顿市莱特州立大学数学与统计学院及布恩邵夫特医学院联合任命的教授。从1993年开始他担任莱特州立大学统计咨询中心主任。自1980年以来,他一直任教于莱特州立大学,期间也曾在瑞典的乌普萨拉大学,于默奥大学及达拉那大学访问并担任教学、研究和咨询的相关职务。他的专业领域是统计方法,尤其是在分类响应模型,拟合检验以及Cox回归模型方面。
关于作者
丛书编辑介绍
第1章 介绍
第2章 关联结构
第1节 离散变量的统计独立
第2节 比值比:二向表
第3节 比值比:三维列表
第4节 模型拟合:三维表
第5节 多向表
第3章 对数线性模型回顾
第1节 二向列联表
第2节 三维列联表
第3节 三维表LLM之间的关系
第4节 LLM和列联表属性
第5节 多向表
第4章 对数线性模型的关联图
第1节 基本图论法则
第2节 三向表的关联图
第3节 多维表的关联图
第4节 可分解的LLM
第5节 总结
第5章 可压缩性条件和关联图
第1节 三维列联表的可压缩性
第2节 压缩性定理和关联图
第3节 结论
第6章 生成多重图
第1节 构建多重图
第2节 三维表格的多重图
第3节 多维表的多重图
第4节 最大生成树
第5节 可分解性
第6节 分解可分解LLM的联合概率
第7节 可分解LLMs的基本条件独立
第7章 不可分解对数线性模型的基本条件独立
第1节 边割集
第2节 不可分解LLM的FCI
第3节 使用多重图 的压缩条件
第4节 FCI:总结
第8章 结论及附加实例
第1节 关联图和多重图的比较
第2节 附加实例
第3节 最后要点
数据集
参考文献
译名对照表