'阿尔戈斯的低质量数据与建筑施工中的低质量水泥相同'

Vivek Gadodia

“您的算法质量仅与数据质量一样好”。新手和专业人员都犯的一个大错误是低估了数据的重要性以及缺乏支付数据的意愿。

假设您是承包商,并用劣质水泥或其他材料建造桥梁。会发生什么?桥梁迟早会倒塌。

算法交易中的数据等同于建筑中使用的材料。让我们看看在处理数据时要注意的一些重要方面。

相关新闻美元/印度卢比犹豫不决表明回调趋势可能不会持续太久,因为人们对冠状病毒传播的担忧或沃达丰想法的死机令金价攀升。所有人都将目光投向Apex Court,寻求新的生活

公司行为调整:

世界上没有“免费午餐”。互联网上有许多数据源,可免费获得数据。

雅虎!Finance或Google Finance是很好的免费资源,可以开始建立基于每日数据的模型。但是,这些数据并未针对“公司操作”(例如奖金或拆分)进行调整。

让我们说,L&T宣布发放奖金,股价从2,000卢比减半至1,000卢比。如果未对此进行调整,并且算法在拆分之前(即过时)有一个运行的卖出信号,那么回测结果将显示出巨大的利润(额外增加了50%),仅因为第二天价格将在1000美元左右开盘。

如果我们不够谨慎以消除此问题,我们将有过度乐观的期望。Versa副总裁,如果这是我们一直在发出的买入信号,则我们会有过分悲观的期望。

缺失数据:

在大多数免费资源中,可能几个月甚至几年都缺少数据。如果以图表的形式绘制,将会出现巨大的尖峰或缺口。

所有技术指标和价格行为算法均依赖数据。这样的差距会破坏回测中的算法信号,并给出错误的结果。均线可能突然下降或上升太多,或者ADX可能突然上升或下降。

盘中数据:

每日数据仍然很容易获得,但日内数据却并非如此。我们为什么需要这个?还记得,Infibeam吗?该股在一个交易日内下跌了72%。

如果Algo在跌倒之前呆了很久,一个人的心脏和口袋都会被烧毁,而一天之末就会退出。因此,为了最大程度地降低风险,可以缩短时间范围。

数据的时间范围取决于我们要构建Algos的最小时间范围。如果要构建15分钟算法,则需要15分钟或更短的时间范围数据。

我们无法使用每小时数据构建一个15分钟的时间范围系统,我们必须从授权的数据供应商处获取此数据。

死库存:

如果没有死库存,我们的数据并非没有生存偏差。这可能很难并且昂贵,但是非常有价值。其中将包括被除牌或停牌的股票,如萨蒂扬。

届时,即2009年,Algo是否会交易萨蒂扬(Satyam)交易,这将真正反映出该战略的真实情况;如果是,该事件如何影响Algo的表现?

公开交易:

最后一笔未平仓交易必须以收盘价掉仓或平仓(即名义上平方)。否则,仅凭此一次开放交易,它可能会显示超过100%的盈亏。虽然很小,但需要插入它才能获得逼真的图像。

(作者是Dravyaniti Consulting LLP的联合创始人Vivek Gadodia)

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。