Kaggle Ubiquant Market Prediction 公榜前4方案

Kaggle Ubiquant Market Prediction 公榜前4方案 ,第1张

前言

距离上次拿到kaggle比赛冠军也有一段时间了,这次集中精力在最后几周冲刺了一下九坤举办的这个量化比赛,目前比赛的公榜排名为第四名(公榜中有两人用了历史泄漏信息导致分数虚高)。


这次比赛的比赛方是九坤。


九坤投资(北京)有限公司是国内成立最早、投资管理经验丰富的多策略量化私募基金管理人之一,现资产管理规模超过100亿人民币。


公司创始人自2011年开始研究中国A股量化交易策略,2012年成立公司,2014年获得“私募证券投资基金管理人”资格。


这次比赛由于比赛方使用了可以公开获得的Ashare历史数据,特征纬度为300维,包含5年内的训练数据,id作为特征给了出来。


有不少选手通过匹配历史走势可以获得很高的分数。


这一次的比赛方使用了time-series api,防止时序信息泄漏的发生,因而很多专注于挖掘泄漏的选手没有参加比赛。


但是美中不足的是,比赛方又鼓励了选手使用私有额外数据(这其实和kaggle一贯的竞赛规则不符,kaggle要求选手使用的额外数据集必须是其他选手都能拿到的),最后比赛方还打算在公榜结束后才给选手提供公榜数据,用于训练模型…

不得不说这个比赛的参赛门槛很高,比一般的私募量化的面试笔试题要难上数个等级了。


这个额外数据集在读取后会占用接近一半的内存,再读取原有的训练数据,还剩下2~3GB的内存拿来训练模型,确实很考验内存管理的功底…这里附上一张图:

比赛方案

这次比赛的方案…

总结

欢迎分享,转载请注明来源:内存溢出

原文地址: http://www.outofmemory.cn/langs/570855.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-09
下一篇 2022-04-09

发表评论

登录后才能评论

评论列表(0条)

保存