为何将机器学习应用于投资?
答案很简单:因为如此呈现出的风险调整后收益更高。从业人员已普遍发现,在预测股票横截面收益上,机器学习衍生的alpha模型表现优于更为传统的线性模型。
在最新研究中,荷宝探讨了机器学习与其他已知量化技术间的关系,同时探究了机器学习卓越表现背后的关键性因素——非线性效应。其中,财务预警信号和股票收益之间的交互效应便是一个有趣的例子。
机器学习算法的另一个显著特征是它们的所谓“发现知识”的能力。鉴于它们设定的目的是为寻找关系,机器学习算法可以在不限定假设的情况下破译出输入信息和输出信息之间的联系。
投资者需注意…
值得注意的是,金融市场不同于现代生活中的其他领域,尽管机器学习在后者场景中的应用已取得长足发展。金融市场固有的复杂性带来了明显的挑战。例如,荷宝研究中强调的金融数据的低信噪比。这意味着我们通常不能凭借任何一个指标来预测一支证券的表现。
另一个难点与数据量有关,而数据量是驱动机器学习算法能力的重要因素。虽然金融领域看似拥有海量数据,但较之那些机器学习已蓬勃发展的其他领域,金融领域的数据量仍相对较少。
最后,金融市场具有自适性。投资者会随着时间的推移去“学习”,从而能够根据需求去改变投资方法。然而,机器学习却倾向于在静态系统中表现更好,这也带来了潜在的难题。
迎击应用挑战
由于样本数据历史较短,因此可能出现过度拟合与虚假相关关系的情况。尽管常规解决技术在金融场景中不一定适用,但人的直觉与经济学知识能够提供显著帮助。荷宝在研究中通过使用SHAP(SHapley Additive exPlanation)值,对此进行了阐述。
荷宝建议到,基于机器学习的投资者应该建立一个强大的数据代码基础设施,以应对潜在可复制性挑战。这将包括一个强大的代码版本控制系统,以及容纳所有经测试迭代和假设的文档。
量化投资者将熟悉前瞻性偏差(look-ahead bias)和更为普遍的数据泄露问题。当训练集中使用的数据包含可用于推断预测的信息时,这些信息在实际运作中是机器学习模型无法获取的,便会出现以上现象。荷宝在研究中概述了可以抵消这一潜在隐患的各种技术。
机器学习在金融领域的应用示例
荷宝研究 进一步分析了机器学习在金融投资领域的实际应用:
预测股票横截面收益
这里使用的机器学习算法比较的是证券的相对回报而非绝对回报,以预测证券的价格的涨跌。机器学习算法的表现优于传统线性方法。预测股市崩盘
此处应用稍有不同的是,这一应用只关注表现最差的股票,为保守型策略提供了潜在利好,从而排除最有可能崩盘的投资项。事实证明这一机器学习算法的表现较传统方法更优异,很大程度上影响着行业选股。预测基本面变量
公司基本面对其股票的价格和表现存在主要影响。更为稳定的基本面指标或许比股票收益更易预测。机器学习模型能够进行更准确的收益预测。关键的结论是,无论是传统的还是机器学习的集成模型,都比独立模型预测更加准确。多语言自然语言处理(NLP)
总体而言,一个全球性投资组合或涉及20-30个不同的国家,而投资者可能只懂两到三种语言。这一背景下,我们便可以用NLP技术来克服这一障碍。以中文为例,NLP可以同时检测标准中文以及俚语中的投资术语。此外,这一实践也将有助于投资者理解外文书写的投资博客。
路在何方?
近期围绕GPT的讨论热度为投资者提供了进一步关注机器学习在金融领域应用的良机。鉴于金融市场的独特属性,荷宝研究阐述了使用机器学习并不一定是投资者的单项押注。这里提及的机器学习应用仅代表其部分潜能。未来,这一强大的工具或将带来更多的趣味和创新点。
免责声明:
本文由荷宝私募基金管理(上海)有限公司(“荷宝上海”)编制, 本文内容仅供参考, 并不构成荷宝上海对任何人的购买或出售任何产品的建议、专业意见、要约、招揽或邀请。本文不应被视为对购买或出售任何投资产品的推荐或采用任何投资策略的建议。本文中的任何内容不得被视为有关法律、税务或投资方面的咨询, 也不表示任何投资或策略适合您的个人情况, 或以其他方式构成对您个人的推荐。本文中所包含的信息和/或分析系根据荷宝上海所认为的可信渠道而获得的信息准备而成。荷宝上海不就其准确性、正确性、实用性或完整性作出任何陈述, 也不对因使用本文中的信息和/或分析而造成的损失承担任何责任。荷宝上海或其他任何关联机构及其董事、高级管理人员、员工均不对任何人因其依据本文所含信息而造成的任何直接或间接的损失或损害或任何其他后果承担责任或义务。本文包含一些有关于未来业务、目标、管理纪律或其他方面的前瞻性陈述与预测, 这些陈述含有假设、风险和不确定性, 且是建立在截止到本文编写之日已有的信息之上。基于此, 我们不能保证这些前瞻性情况都会发生, 实际情况可能会与本文中的陈述具有一定的差别。我们不能保证本文中的统计信息在任何特定条件下都是准确、适当和完整的, 亦不能保证这些统计信息以及据以得出这些信息的假设能够反映荷宝上海可能遇到的市场条件或未来表现。本文中的信息是基于当前的市场情况, 这很有可能因随后的市场事件或其他原因而发生变化, 本文内容可能因此未反映最新情况, 荷宝上海不负责更新本文, 或对本文中不准确或遗漏之信息进行纠正。