本书在统一视角下,体系化地介绍了因子投资中的重要研究方法,并针对中国A 股市场给出了独立的、可复制的、高质量的因子实证分析结果,是一本真正可操作、可上手的因子投资手册。本书主要内容包括:因子投资基础、因子投资方法论、主流因子解读、多因子模型、异象研究、因子研究现状和因子投资实践。书中还以附录的形式对理解资产价格的研究脉络进行了梳理。本书的写作既注重学术文献的严谨,也注重普通读者的阅读体验。书中虽然涉及必要的数学公式,但是会深入浅出、抽丝剥茧地解释统计方法,并把重点放在实证分析上,同时也会对因子投资的实务进行解读。
适读人群 :本书适合与因子投资相关的从业人员、与实证资产定价相关的学生和老师,以及对因子投资理念感兴趣的读者。 因子投资在国内的股票和债券市场上已经得到了广泛的应用,相应的中文版图书却是一片空白。本书为弥补这个遗憾而写作。作者既梳理了近50年来学术界和业界的理论方法,又针对中国A股市场给出了独立的、可复制的、高质量的因子实证分析结果,对中国资本市场的发展和完善意义深远。
本文作者来自“川总写量化”“因子动物园”的创作者石川、刘洋溢和连祥斌,他们创作的关于因子投资的高质量内容早已得到学术界和业界的高度认可。
√一览全貌:从学术界、管理人和投资者三个维度详述因子投资基础
√奠定基础:投资组合排序法、广义矩估计等因子分析常用的统计学方法介绍
√理解应用:以A股市场为对象,从因子、多因子模型和异象三个角度进行实证分析
√热门话题:多重假设检验对挖掘因子和异象的危害、行为金融学、机器学习与因子投资等
√投资务实:以多因子模型为数量化工具的主动投资和Smart Beta 投资实践等
√专业避坑:娓娓道来因子投资实践中会遇到的各种“坑”,少走弯路,实现高效投资
√作者愿景:理论和实践结合的经典,一本真正可操作、可上手的因子投资手册
前言
自从20世纪60年代资本资产定价模型被提出以来,实证资产定价经过学术界50 多年的发展,形成了完善的研究体系,并获得了丰富的实证结果,而从中演化出来的因子投资如今也早已成为海外资产管理人必备的重要工具,其在资产配置和获取超额收益方面均大有作为。在因子投资领域,海外的学术界和业界出版了很多经典专著,系统化地介绍因子投资的研究方法和投资实务。遗憾的是,虽然因子投资已经在国内的股票和债券市场上得到广泛的应用,但在相应的中文版书籍方面仍然是一片空白。本书是为了填补这个空白而做的一点努力。
本书的目标是在统一视角下成体系地介绍因子投资中重要的研究方法,并针对中国A股市场给出独立、可复制、高质量的因子实证分析结果,从而成为一本因子投资的专业工具书。本书的写作将不失学术文献的严谨,但作者也会时刻考虑读者的阅读体验,使其成为真正可操作、可上手的因子投资手册。书中虽然会不可避免地涉及必要的数学公式,但作者无意将本书写成一本纯理论性书籍,行文中将会深入浅出、抽丝剥茧地解释统计方法,并把重点放在实证分析上,同时会对因子投资的实务进行解读。本书适合与因子投资相关的从业人员、与实证资产定价相关的学生和老师,以及对因子投资理念感兴趣的读者。
本书内容共七章,可以被分成三个部分。第一部分包括第1 章和第2 章。第1 章抛出研究因子投资的统一视角,它是全书的灵魂,后续所有内容都将围绕它展开。在此基础之上,第1章将从学术界、管理人和投资者三个维度综述因子投资基础,让读者在接触具体细节之前首先掌握因子投资的全貌。第2章介绍学术界在分析因子时最常用的统计学方法,例如投资组合排序法、Fama??MacBeth 回归法、Newey??West 调整以及广义矩估计等,它们都是实证资产定价研究中耳熟能详的名字。本章的内容是全书的核心,可以为读者进行系统性的因子研究奠定基础。
第3章~第5章可被视为本书的第二部分。它们将以A 股市场为对象,使用第2 章介绍的方法,从因子、多因子模型以及异象三个角度进行详尽的实证分析。这三章的内容主要起到两个作用:(1)通过剖析过去20年A股市场中不同风格因子和异象的表现,加深读者对市场的理解;(2)通过理论和实际的结合,帮助读者掌握各种分析方法在研究异象、因子以及多因子模型方面的应用。
第6章和第7章可被视作本书的第三部分。它们均属于进阶课题,使全书既丰满又紧贴因子投资实务。其中,第6 章介绍学术界因子研究的现状,涉及的内容包括多重假设检验对于挖掘因子和异象的危害、行为金融学的研究框架以及机器学习与因子投资等,它们都是近年来学术界的热门话题。第7 章将阐述因子投资实践中的方方面面,包括以多因子模型为数量化工具进行的主动投资,以及时下流行的Smart Beta 投资实践等内容,为读者娓娓道来因子投资中会遇到的各种“坑”。
因子投资所涵盖的内容博大精深。本书三位作者在写作过程中经常就某个课题进行深入探讨、对实证的代码和数据进行反复检查,只求做到书中每个文字、每个数字都是严谨而正确的。在这个过程中,我们也充分感受到,在践行因子投资这条充满荆棘的道路上,有一些志同道合的挚友是多么幸福。愿本书也能成为各位读者在实践因子投资时的挚友。由于作者所学知识有限,书中难免有不当之处,烦请读者指正。另外,市场有风险,入市需谨慎。本书内容不可视为投资人最终的投资意见。书中配套网站见factorwar.com。
在本书的写作过程中,我们得到了很多来自学者、同行、朋友和家人的大力支持和热情帮助,在此向他们表示最真挚的感谢。特别感谢芝加哥大学布斯商学院修大成教授、清华大学五道口金融学院余剑峰教授、中国人民大学商学院张然教授,以及荷宝投资(Robeco)量化股票研究团队主管周维礼女士、易方达基金管理有限公司指数增强投资部总经理林飞先生、嘉实基金管理有限公司量化投资部总监刘斌先生对本书内容的指正和推荐。此外,石川先生还感谢王洪岐先生、王飞先生、吴俊文先生的信任和帮助,以及合伙人任重先生和高嵩先生的支持。本书的出版自然也离不开电子工业出版社的认可与支持。本着打磨精品这样一个共同的目标,三位作者和电子工业出版社的编辑在本书的创作全过程中进行了深入和高效的合作。特别感谢陈林编辑的持续帮助和鼓励。感谢电子工业出版社各位老师在本书校订过程中的辛勤付出。感谢李玲为本书设计了精美的封面。相信本书不会让读者失望。
希望本书能够带你走入古老与创新并存、理论和实践并重的因子投资,掌握因子投资方法,体验因子投资魅力,更重要的是使用因子投资在市场中获得更高的风险调整后收益。
这是本书作者由衷的期望。
这是写给你的因子投资。
石川
北京量信投资管理有限公司创始合伙人,首席科学家;清华大学学士、硕士,麻省理工学院博士;现任知名期刊 Computers in Industry编委会委员和十余家国际期刊审稿人;曾就职Citigroup、Oracle 及P&G。石川博士精通各种概率模型和统计建模方法,擅于以金融数学分析为手段进行资产配置、投资组合风险管理、量化多因子选股及衍生品 CTA 策略的开发,并对行为金融学有独到的见解,其研究成果多次发表于European Journal of Operational Research等国际期刊。
刘洋溢
西南财经大学金融学博士研究生,曾有数年量化交易经验和FoF研究经验。当前主要研究方向为实证资产定价,特别是因子定价模型、投资异象、基金及资产配置的研究。
连祥斌
东北财经大学社会与行为跨学科研究中心行为金融学硕士,曾在私募基金公司和金融科技公司担任量化研究员,负责量化策略的研发和交易。现任中欧瑞博量化策略研究员,负责 CTA、量化选股、量化择时及大类资产等研究工作。研究方向包括资产配置、因子投资和组合管理等领域,精通MATLAB、Python和SQL等语言,熟悉各类量化模型和程序化交易。
第1 章因子投资基础
1.1 统一视角下的因子投资 1
1.1.1 一个公式 1
1.1.2 因子、多因子模型和异象3
1.1.3 再论异象和因子 5
1.1.4 因子投资包含的内容6
1.1.5 实证资产定价与因子投资9
1.2 因子投资的学术起源 11
1.2.1 实证资产定价 11
1.2.2 研究现状 13
1.3 因子投资的业界发展 14
1.3.1 因子投资和管理人15
1.3.2 因子投资和投资者16
1.4 本书的结构 19
第2 章因子投资方法论
2.1 投资组合排序法 22
2.1.1 因子模拟投资组合22
2.1.2 排序法及其检验 24
2.1.3 多重排序法 28
2.1.4 因子命名约定 33
2.2 多因子模型的回归检验 34
2.2.1 时间序列回归 36
2.2.2 截面回归 39
2.2.3 时序回归vs 截面回归42
2.2.4 Fama–MacBeth 回归45
2.2.5 不同回归方法比较48
2.3 因子暴露和因子收益率 48
2.3.1 引入工具变量 50
2.3.2 使用公司特征 51
2.3.3 两类模型 52
2.4 异象检验 53
2.4.1 时序回归检验异象54
2.4.2 计量经济学问题 55
2.4.3 White 估计量和Newey–West 估计量57
2.4.4 截面回归检验异象59
2.5 多因子模型比较 60
2.5.1 GRS 检验 61
2.5.2 均值--方差张成检验62
2.5.3 从几何角度比较GRS 和均值--方差张成 66
2.5.4 α 检验 70
2.5.5 贝叶斯方法 70
2.6 因子正交化 72
2.6.1 简单一元回归 73
2.6.2 回归的几何意义 73
2.6.3 用正交化过程求解多元回归 75
2.7 广义矩估计 78
2.7.1 样本均值的方差 78
2.7.2 分析框架 80
2.7.3 数学基础 84
2.7.4 有效性 86
2.7.5 不应成为黑箱 88
2.8 研究方法建议 89
第3 章主流因子解读
3.1 数据和流程 91
3.1.1 数据来源 91
3.1.2 量价数据处理 92
3.1.3 财务数据处理 95
3.1.4 因子构造流程 102
3.1.5 实证设定 106
3.2 市场因子 107
3.2.1 市场因子起源 107
3.2.2 对CAPM 的质疑108
3.2.3 市场因子实证 109
3.3 规模因子 112
3.3.1 规模因子起源 112
3.3.2 规模因子成因 113
3.3.3 规模因子实证 113
3.4 价值因子 117
3.4.1 价值因子起源 117
3.4.2 价值因子成因 118
3.4.3 价值因子实证 119
3.5 动量因子 124
3.5.1 动量因子起源 124
3.5.2 动量因子成因 125
3.5.3 动量因子实证 127
3.6 盈利因子 131
3.6.1 盈利因子起源 131
3.6.2 盈利因子成因 132
3.6.3 盈利因子实证 134
3.7 投资因子 138
3.7.1 投资因子起源 138
3.7.2 投资因子成因 139
3.7.3 投资因子实证 140
3.8 换手率因子 146
3.8.1 换手率因子起源 146
3.8.2 换手率因子成因 147
3.8.3 换手率因子实证 148
第4 章多因子模型
4.1 主流多因子模型综述 153
4.1.1 Fama–French 三因子模型154
4.1.2 Carhart 四因子模型156
4.1.3 Novy–Marx 四因子模型 157
4.1.4 Fama–French 五因子模型158
4.1.5 Hou–Xue–Zhang 四因子模型 161
4.1.6 Stambaugh–Yuan 四因子模型 164
4.1.7 Daniel–Hirshleifer–Sun 三因子模型 167
4.2 A 股中被定价的因子 171
4.2.1 Fama–MacBeth 回归实证设定 171
4.2.2 Fama–MacBeth 回归结果172
4.3 多因子模型比较:来自A 股的例子 173
4.3.1 两个模型 173
4.3.2 BM、ROE 与预期收益174
4.3.3 模型比较的实证结果176
4.4 多因子模型的简约性 187
第5 章异象研究
5.1 估值高低中的异象 191
5.1.1 价值因子与价值投资192
5.1.2 F-Score 193
5.1.3 G-Score 195
5.1.4 通过预期差获取超额收益198
5.2 基本面锚定反转 202
5.2.1 金融学依据 203
5.2.2 A 股市场中的基本面锚定反转 204
5.3 特质性波动率 210
5.3.1 套利不对称性和特质性波动率 212
5.3.2 A 股市场中的特质性波动率异象 213
第6 章因子研究现状
6.1 p-hacking 和“因子动物园”222
6.1.1 何为p-值 222
6.1.2 在追逐p-值的道路上狂奔223
6.1.3 硬科学与软科学 224
6.1.4 正确认识p-值的含义224
6.1.5 多重假设检验 226
6.1.6 先验的重要性 229
6.2 从“因子动物园”到“因子大战” 231
6.2.1 形同意不同的投资因子232
6.2.2 q5 模型 233
6.2.3 因子大战 234
6.3 用行为金融学解释异象和因子236
6.3.1 套利限制 238
6.3.2 预期中的偏差 240
6.3.3 风险偏好中的偏差244
6.3.4 认知限制 250
6.3.5 行为金融学与市场异象251
6.3.6 行为有效市场 255
6.4 投资者情绪 256
6.4.1 投资者情绪的度量257
6.4.2 投资者情绪与异象表现259
6.4.3 投资者情绪与市场表现261
6.5 风险补偿、错误定价还是数据窥探 262
6.5.1 风险补偿检验 262
6.5.2 错误定价检验 263
6.5.3 数据窥探检验 266
6.6 因子样本外失效风险 268
6.6.1 曝光导致错误定价减弱269
6.6.2 因子拥挤 270
6.6.3 交易成本 271
6.7 因子投资难以取代基本面分析273
6.7.1 基本面分析 274
6.7.2 基本面量化投资 275
6.7.3 基本面投资“因子化”的不足 277
6.7.4 思考和讨论 279
6.8 机器学习与因子投资 280
6.8.1 线性模型 281
6.8.2 非线性模型 283
6.8.3 模型评估与实证研究285
6.8.4 主成分分析和因子选择287
6.8.5 机器学习的问题 290
第7 章因子投资实践
7.1 收益率模型:获取“阿尔法”293
7.1.1 基本术语 293
7.1.2 寻找预测变量 294
7.1.3 挑选预测变量 295
7.1.4 收益率预测 299
7.2 风险模型:以Barra 为例307
7.2.1 Barra 多因子模型307
7.2.2 模型求解 309
7.2.3 纯因子投资组合 311
7.2.4 协方差矩阵求解及调整313
7.3 投资组合优化 319
7.3.1 错位的收益与风险模型319
7.3.2 目标函数 322
7.3.3 不同目标函数的比较324
7.3.4 约束条件 326
7.3.5 交易成本模型 330
7.4 Smart Beta:因子投资的捷径331
7.4.1 因子指数和Smart Beta332
7.4.2 为什么要投资Smart Beta339
7.4.3 如何投资Smart Beta342
7.4.4 应用实践 348
7.4.5 更多讨论 356
7.5 因子择时 357
7.5.1 按因子估值择时 357
7.5.2 按因子动量择时 359
7.5.3 按因子波动择时 359
7.5.4 按市场情绪择时 360
7.5.5 按宏观因素择时 361
7.5.6 因子择时很难 363
7.6 风格分析 363
7.6.1 经典风格分析 364
7.6.2 基于多空因子的风格分析366
7.6.3 实例:巴菲特的投资风格367
7.7 风险归因 370
7.7.1 两种传统风险归因方法371
7.7.2 风险的三要素 371
7.7.3 从风险角度看收益相关性373
7.7.4 将三要素公式应用于多因子模型 375
7.8 因子投资展望 376
7.8.1 另类数据 376
7.8.2 用因子实现大类资产配置381
后记
附录A 理解资产价格
参考文献