距离上次拿到kaggle比赛冠军也有一段时间了,这次集中精力在最后几周冲刺了一下九坤举办的这个量化比赛,目前比赛的公榜排名为第四名(公榜中有两人用了历史泄漏信息导致分数虚高)。
这次比赛的比赛方是九坤。
九坤投资(北京)有限公司是国内成立最早、投资管理经验丰富的多策略量化私募基金管理人之一,现资产管理规模超过100亿人民币。
公司创始人自2011年开始研究中国A股量化交易策略,2012年成立公司,2014年获得“私募证券投资基金管理人”资格。
这次比赛由于比赛方使用了可以公开获得的Ashare历史数据,特征纬度为300维,包含5年内的训练数据,id作为特征给了出来。
有不少选手通过匹配历史走势可以获得很高的分数。
这一次的比赛方使用了time-series api,防止时序信息泄漏的发生,因而很多专注于挖掘泄漏的选手没有参加比赛。
但是美中不足的是,比赛方又鼓励了选手使用私有额外数据(这其实和kaggle一贯的竞赛规则不符,kaggle要求选手使用的额外数据集必须是其他选手都能拿到的),最后比赛方还打算在公榜结束后才给选手提供公榜数据,用于训练模型…
不得不说这个比赛的参赛门槛很高,比一般的私募量化的面试笔试题要难上数个等级了。
这个额外数据集在读取后会占用接近一半的内存,再读取原有的训练数据,还剩下2~3GB的内存拿来训练模型,确实很考验内存管理的功底…这里附上一张图:
这次比赛的方案…
总结欢迎分享,转载请注明来源:内存溢出
评论列表(0条)