《藏语计算语言学(藏文信息处理技术)》是国内第一本全面系统地介绍藏语计算语言学的著书,由浅入深地讲解了藏语计算语言学的基本理论和知识框架。《藏语计算语言学(藏文信息处理技术)》在汉语、英语等自然语言计算机处理的相关基本知识和方法的基础上,结合藏语特点,介绍了基于规则的藏语自然语言分析方法,也介绍了基于统计的分析方法。《藏语计算语言学(藏文信息处理技术)》共分四个部分,分别为藏文及藏文信息处理的基础知识、藏文词法分析、藏文句法分析和藏文语义分析。第一部分介绍了计算语言学的基本理论知识、藏文及藏文信息处理的基本知识;第二部分针对藏文信息处理中特有的分词问题,介绍了藏文自动分词及分词规范、分词中歧义的消解、未登录词识别、藏文词性标注及标注标准,以及藏文语料库的相关知识;第三部分从藏语语法的表示入手,将藏语自然语言处理形式化,再给出藏语语法分析的算法;第四部分介绍了藏语语义的表示及分析算法。
《藏语计算语言学(藏文信息处理技术)》可作为高等学校和科研院所计算机专业高年级本科生、藏文信息处理方向研究生的教材,也可以作为从事藏语自然语言处理应用领域的研究人员和技术人员的参考资料。
第1章 计算语言学概论
1.1 计算语言学的定义
1.2 计算语言学的发展历程
1.3 计算语言学的研究范畴
1.4 计算语言学的研究方法
1.5 计算语言学与藏语研究
1.6 计算语言学的发展趋势
第2章 计算语言学基础知识
2.1 概率统计基础
2.1.1 事件和概率
2.1.2 随机变量与分布函数
2.1.3 随机变量的数字特征
2.1.4 最大似然估计
2.2 信息论基础
2.2.1 信息的最优编码设计
2.2.2 信息熵
2.2.3 噪声信道模型
2.3 隐马尔可夫模型
2.3.1 马尔可夫过程
2.3.2 隐马尔可夫过程
2.3.3 向前算法和向后算法
2.3.4 韦特比(Viterbi)算法
2.3.5 Baum-We1ch算法
第3章 形式语法与自动机理论
3.1 形式语法
3.1.1 形式定义
3.1.2 形式语法分类
3.2 自动机理论
3.2.1 自动机概述
3.2.2 自动机术语
3.2.3 形式描述
3.2.4 有限自动机的分类
3.2.5 有限自动机的扩展
第4章 藏文信息处理
4.1 藏文概述
4.2 藏文字的构件
4.3 藏文的拼与写
4.3.1 藏文拼音规则
4.3.2 藏文虚词形态规则
4.3.3 藏文字体
4.4 藏文编码与标准
4.4.1 编码标准
4.4.2 键盘及字库标准
第5章 藏文自动分词
5.1 藏文自动分词概述
5.1.1 藏文自动分词的意义和作用
5.1.2 藏文文本的切分特点
5.1.3 藏文自动分词的难点
5.2 藏文分词规范
5.2.1 制定藏文分词规范的目标
5.2.2 藏文分词规范简介
5.3 藏文分词词典
5.3.1 藏文分词词典的机制
5.3.2 基于词属性的藏文分词词典
5.4 藏文分词方法
5.4.1 基于规则的分词方法
5.4.2 基于统计的分词方法
5.4.3 基于规则和统计的方法利弊
5.4.4 专家系统分词法
5.4.5 基于神经网络的分词方法
5.5 藏文分词歧义理论
5.5.1 藏文分词歧义的类型
5.5.2 歧义消解的方法
5.6 藏文未登录词
5.6.1 藏文未登录词分类
5.6.2 藏文未登录词的识别方法
第6章 藏文词类自动标注
6.1 藏文词类划分的意义
6.2 藏文词类划分的理论依据
6.3 藏文词类体系
6.4 藏文词类及标记集规范
6.4.1 适用范围
6.4.2 词类及标记集规范确定原则
6.5 藏文词性自动标注
6.5.1 词性标注
6.5.2 难点分析
6.6 词性标注方法
6.6.1 基于规则的方法
6.6.2 基于统计的方法
6.6.3 规则与统计相结合的方法
6.7 HMM在藏文词性标注中的应用
6.7.1 先验概率和条件概率
6.7.2 HMM的三个基本问题
6.7.3 Viterbi算法
6.7.4 HMM与词性标注的关系
第7章 藏文语料库与词汇知识库
7.1 语料库的定义
7.2 语料库的作用
7.2.1 对藏语语言研究的作用
7.2.2 对藏语自然语言处理的作用
7.2.3 多学科综合研究
7.3 语料库的发展简史
7.3.1第一代(20世纪70-80年代)
7.3.2第二代(20世纪80-90年代)
7.3.3第三代(20世纪90年代至今)
7.4 国内语料库建设概况
7.5 语料库的分类
7.6 藏文语料库的设计
7.7 藏文语料库构建原则
7.8 藏文语料库的应用
7.9 藏文语料库的标记及其规范
7.10 藏文语料库的标记框架
7.10.1 藏文语料库中文本属性的标记
7.10.2 藏语文本结构信息的标记
7.10.3 段落标记
7.10.4 句子标记
7.10.5 词汇标记
7.11 藏文语料库框架标记范例
7.12 词汇知识库
7.12.1 FrameNet
7.12.2 WordNet
7.12.3 GKB
7.12.4 HOWNet
第8章 藏语句法知识的表示
8.1 基于短语结构的藏语句法形式化
8.1.1 短语结构语法概述
8.1.2 短语结构语法构成要素
8.2 基于范畴语法的藏语句法形式化
8.2.1 范畴语法概述
8.2.2 范畴语法的基本思想和规则
8.2.3 范畴语法与藏语句法形式化
8.3 基于词汇功能的藏语句法形式化
8.3.1 词汇功能语法概述
8.3.2 词汇功能语法理论框架
8.3.3 LFG两种语法层次结构
8.4 基于功能合一的藏语句法形式化
8.4.1 复杂特征集的定义
8.4.2 藏语词汇的定义描述
8.4.3 藏语句法规则的描述
8.4.4 藏语语义规则的描述
8.4.5 藏语句子合一运算的描述
8.5 基于依存的藏语句法形式化
8.5.1 依存语法概述
8.5.2 依存语法理论
8.5.3 依存语法的定义
8.5.4 依存结构图
第9章 藏语句法分析
9.1 句法分析概述
9.2 基于规则的分析方法
9.2.1 自顸向下分析算法
9.2.2 自底向上分析算法
9.2.3 富田算法
9.2.4 左角分析法
9.2.5 CYK算法
9.2.6 Earley算法
9.3 基于统计的分析方法
9.3.1 基于概率上下文无关文法模型
9.3.2 上下文依存的概率模型
9.3.3 词汇语法的概率模型
9.3.4 基于历史的模型
第10章 藏语语义知识的表示
10.1 语义和逻辑形式
10.2 基本逻辑形式语言
10.3 动词与逻辑形式中的状态
10.4 框架知识表示
10.4.1 框架知识概述
10.4.2 框架知识结构与组织
10.4.3 框架知识语义关系
第11章 藏语语义分析
11.1 藏语语义成分分析
11.1.1 义素分析概述
11.1.2 义素的基本概念
11.1.3 义素分析的原则
11.1.4 义素分析的方法
11.2 藏语语义特征分析
11.2.1 语义特征的定义
11.2.2 语义特征分析法的产生
11.2.3 义素分析与语义特征分析的区别
11.2.4 语义特征分析法
11.2.5 语义特征分析法的类别
11.3 配价语法与藏语语义分析
11.3.1 配价理论的提出
11.3.2 配价的概念及表示方法
11.3.3 配价的层次
11.3.4 配价成分的定价原则及理论内涵
11.3.5 配价理论与藏语格语法
11.3.6 藏语动词配价
11.3.7 藏语形容词配价
11.3.8 藏语语义配价
11.4 格语法与藏语格语义分析
11.4.1 格语法理论的提出
11.4.2 格的定义
11.4.3 格语法的理论框架
11.4.4 表层现象
11.4.5 藏语格的基本概念
11.4.6 藏语格的语法信息描述
11.4.7 藏语格的功能结构分析
11.4.8 藏语格的语义信息分析
11.5 语义解释与组合理论
11.5.1 组合理论
11.5.2 九表达式与语义解释
11.6 带语义解释的简单语法和词典
11.7 特征合一语义解释1
11.8 语法关系与语义分析
11.9 语义语法与语义分析
第12章 藏语歧义消解
12.1 藏语语义关系与真歧义
12.2 语义网络
12.3 统计词义消歧
12.4 搭配与互信息
附录
附录1 信息处理用藏语词类标记集规范
附录2 信息处理用现代藏文分词规范
参考文献