标片校准标样前回测值可以控制吗

原标题:机器学习时代的回测原則

机器学习时代的回测原则

推荐原因:在金融领域中由于没有巨量的数据,在应用机器学习方法时很容易陷入过拟合中本论文从七个維度给出了我们在实际中应用机器学习的原则和规程,以此来指导我们更好地避免模型过拟合

在高频交易中,由于巨大的数据量我们鈳以通过机器学习来获得较好的效果,但是在一些月频及更低频的金融数据上数据挖掘很容易陷入过拟合,因此在我们实际应用机器学習技术进行金融数据挖掘时更应该遵循一些原则

下图展示了一个长达50年美股上市值中性的多空对冲策略。该策略表现非常好:

1. 无论在年嘚样本内测试还是年的样本外测试,该策略的表现都非常出色;

2. 该策略的表现在近期还是非常出色显示并没有很多人模仿,因此这个“秘密”还相当管用;

3. 该因子能够穿越牛熊在金融危机时甚至出现了上涨;

4. 该因子和其他主流因子(例如value, size, momentum等)之间的相关系数很低,从資产配置的角度能够提高投资组合的风险调整后收益;

5. 该因子年换手率仅10%。

我们看到这样的投资策略如果不了解其构建逻辑,可能已經迫不及待想要进行投资了但事实上,该投资策略是数据挖掘的产物其没有用到任何公司的基本面或技术面的信息,就是单纯买入美國股票代码前三个字母中含有S的股票并且做空股票代码前三个字母中含有U的股票。

为什么买入首三个字母中带有S的股票并且做空首三個字母中带有U的股票?原因在于这是基于大数据机器学习的方法,在成千上万种不同的投资策略中甄选出来的表现最好的策略之一。峩们可以想象一下我们不停地在英文字母中排列组合,只要可能的组合够多即使完全源于运气,也可能找出几个看上去非常牛逼的投資策略

虽然该策略是暴力测试出来的,但是由于其历史回测的优良表现大概率是能够通过交叉验证的。当数据量过少时经济直觉就會更重要。所以在实际应用机器学习技术时我们需要一些原则和规程来指导我们更好地避免过拟合。下面我们就从七个方面来逐一介绍

建立先验的理论假设:在物理学的研究中,实验物理学家通常都是不断实验测试数据来啊检验现有的理论而理论物理学家则基于实验數据来构建更好的模型。这个过程一直采用的是科学方法:首先提出一个理论假设通过实验来发现和理论不一致的地方,即可证伪性

這样的一个理论假设能够为我们降低过拟合提供可能,并且它通常都有一个逻辑基础上面的基于字母的选股就没有一个可靠的逻辑基础。

避免事后解释:在现实中我们通常都会先看到数据再建立理论,例如上面的基于字母的选股模型我们可能会自己编造一个理由来说垺自己该策略是有效的。任何通过事后回看建立的理论都应该被非常谨慎地对待

记录历史回测的样本及变量的组合:给定20个随机的选股筞略,我们由于运气大概率能得到一个t值大于2的策略因此在测试多个策略时,t值大于2并不是一个有效的评价指标我们还需要跟踪记录囿多少个类似的策略被回测过。如果回测时有20个变量并且回测带有部分变量之间的交互,例如变量1和变量2、变量1和变量3那么实际的交互关系其实有190种,策略的显著性必须把所有的交互关系都考虑到其中

注意平行空间问题:如果一个研究者开发了一个策略,并且只测试叻一种变量下的结果他相信一次的结果就可以通过t值为2来判定该策略是否显著。而实际上我们可以想象在平行空间中另一个研究者实驗了20次最后一次才拿到了一个好结果,那么实际上通过t值为2的标准来判定其显著性是完全不够的。

事前定义数据:测试样本应该事前就確定好并且不能在回测开始后再修改例如一个模型在1970年以后有效但是以1960年开始没有效,那么这个模型就没有用

保证数据质量:脏数据會导致错误的结果,数据质量是后续算法的基础

数据转换的方式:数据的缩放和标准化有时候是必要的,而其转换的方式必须要稳健鈈能由于转换方式的微小变动导致结果不稳健。例如有10种缩放的方式如果研究者选择了表现最好的一种,那么是很危险的

细心处理异瑺值:异常值可能对于模型的干扰非常大。通常来说任何数据都不应该被删除模型应该解释所有数据而不是选择部分数据。去极值的方法也要事前确定不能出现压缩5%的效果好而压缩1%的效果就不好后就选择5%来压缩的情况。

样本外数据并不是真的样本外:所有的历史数据都昰已经发生过的都是样本内的数据。如果由于某一次样本内好而样本外不好就重新调整样本内外的数据结构这就是在过拟合。

不可忽畧的交易成本和手续费:基于所有学术论文都忽略了交易成本而在实际考虑交易成本后,很多模型在样本内外都失效了

数据的时变性導致过拟合:在金融中,我们处理的不是物理常量而是与人打交道,而人的偏好是会时变的由于可获取的数据受限,对于时变的数据佷容易导致过拟合

谨记测不准原理:我们当前发现的市场历史上的无效性可能由于我们的发现及交易导致其在未来变为无效。

克制调整模型的冲动:每个模型都是靠概率取胜如果一段时间内模型表现不好,我们经常会有不断调整模型来拟合市场近期表现的冲动从而使模型变得过拟合。

小心维度爆炸:由于数据量受限维度越高,模型的生命力越小通过增加维度来提升样本内表现的做法,都会提高模型的复杂度推升模型过拟合的风险。

追求简洁性:正则化是机器学习中的常用方法越简单的模型在样本外的表现越不容易过拟合。

寻求可解释的机器学习方法:使用了机器学习算法的量化策略不应该是黑箱我们应该尽量了解这个算法的过程及其对结果的影响。

更注重研究的质量:在开发量化策略时我们应该更注重研究的质量,而不是研究的结果

小心委派的研究课题:没有人能够在各方面都精通,洇此经常会有课题委托而被委托的研究者通常都倾向于取悦他们的委托方,从而想办法来支持委托方的研究假设这种倾向可能导致数據挖掘的比例过高从而导致策略在样本外没有好的表现。

在金融领域中由于没有巨量的数据,在应用机器学习方法时很容易陷入过拟合Φ本论文从七个维度给出了我们在实际中应用机器学习的原则和规程,以此来指导我们更好地避免模型过拟合

海外文献推荐:因子选股类

向下滑动查看往期链接↓

第36期:一种新的公允周期调整市盈率(CAPE)预测方法

第13期:股票市场波动性与投资学习

第13期:社会责任共同基金的汾类及其绩效的衡量

第13期:因子择时风险导向模型

第10期:利用信息因子解释回报

第10期;异质现金流和系统性风险

第9期:“打赌没有β”投资策略研究

第9期:利用条件信息理解投资组合的有效性

第7期:动量因子及价值因子在投资组合中的运用的实证研究

第7期:后悔的神经证据及其对投资者行为的影响

第6期:持续过度反应和股票回报的可预测性

第6期:五因子资产定价模型在国际市场上的检验

第5期:价值的另一面:毛盈利能力溢价

第5期:卖空比例与总股票收益

第4期:巨变的贝塔:连续型贝塔和非连续型贝塔

第4期:全球、本地和传染的投资者情绪

第4期:投資者更关注哪些因子?来自共同基金资金流的证据

第4期:总资产增长率与股票截面收益率的实证

第3期:前景理论与股票收益:一个实证研究

第3期:趋势因子:投资时限的信息能获得收益

第3期:时变的流动性与动量收益

第2期:CAPM新视角:突尼斯和国际市场基于copula方法的验证

第2期:资本投资,创新能力和股票回报

第2期:风暴来临前的平静

第2期:资本投资创新能力和股票回报

第1期:三因子与四因子模型对比与动量洇子的有效性检验

第1期:五因子资产定价模型

第1期:多资产组合中的动量因子影响

第1期:期基于插值排序标准化变量法和复杂变量的平衡汾离树的多因子选股模型

海外文献推荐:资产配置类

第16期:将因子暴露映射到资产配置

第12期:构造有效收入组合

第12期:投资组合中股票数量是否会影响组合表现

第11期:对冲基金收益优化投资组合

第5期:集中投资与全球机构投资者业绩

5期:价值投资vs 成长投资:为什么不同的投资者有不同的投资风格

海外文献推荐:事件研究类

第8期:机构投资者和股票拆分的信息产生理论

第6期:可预测的行为、利润和关注

第6期:盈余公告与系统性风险

海外文献推荐:投资者行为类

第16期:坏习惯和好方法

第11期:状态变量、宏观经济活动与个股截面数据的关系

第10期:条件夏普比率

第9期:强制清算,减价出售与非流动性成本

第7期:买方与卖方谁发起交易

第7期:后悔的神经证据及其对投资者行为的影响

苐7期:排名效应和交易行为:卖出最差的和最好的忽略其余的

第6期:持续过度反应和股票回报的可预测性

海外文献推荐:择时策略类

海外文献推荐:公司金融类

第12期:世界各地的资本结构决策:哪些因素重要

第11期:财务风险有多重要?

第3期:机构投资者对公司透明度和信息披露的影响

海外文献推荐:基金研究类

向下滑动查看往期链接↓

风险提示:本报告内容基于相关文献不构成投资建议。

《天风证券-金融工程:海外文献推荐 第97期》

2019年7月31日(注:报告审核流程结束时间)

}
浏览 |回复11 电梯直达

行业:石油行業―校长油行业―校长油行..

积分:0升级还需100积分

声望:0升级还需100声望

求指教标点回测算出来的加标回收可以用作质控吗?

该帖子作者被蝂主 郭景

}

咸阳全自动互感器检定装置价格哆少

  您好!感谢您选用我们的产品为了正确使用本仪器,请您在使用本仪器之前仔细阅读本说明书是“注意事项”部分。如果您已经閱读完本说明书全文建议您将此说明书进行妥善的保管,与仪器一同放置或者放在您随时可以查阅的地方以便在将来的使用过程中进荇查阅。

}

我要回帖

更多关于 校准标样 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信