选自GitHub
作者:ZhengyaoJiang、DixingXu、JinjunLiang
机器之心编译
参加:路雪
近来,《ADeepReinforcementLearningFrameworkforpeFinancialPortfolioManagementProblem》的作者开源了该论文的项目代码。这篇文章关于怎么运用深度强化学习进行出资组合办理,提出的DRL结构功能大大优于其他算法。机器之心对论文摘要进行了扼要翻译,附GitHub完成。
论文链接链接
GitHub地址链接
论文:ADeepReinforcementLearningFrameworkforpeFinancialPortfolioManagementProblem
摘要:金融出资组合办理是将资金不断分配到不同的金融产品,以期取得更大累计收益的进程。本文展现了一个不运用金融模型的强化学习结构,为出资组合办理问题供给深度机器学习解决方案。该结构包括EIIE拓扑、出资组合内存、在线随机批量学习,和针对即时奖赏的奖赏函数。本研讨中该结构在三种情况下得到完成:卷积神经络、根底循环神经络和长短期回忆络。它们和很多近期评定或发布的出资组合挑选战略阅历了三次后验测验试验,试验中加密钱银市场的买卖周期是30分钟。加密钱银是一种去中心化的电子钱银,其间最著名的便是比特币。该结构的三种实例在一切试验中稳稳占有前三名的方位,优于其他买卖算法。虽然后验测验中的佣钱率高达0.25%,该结构依然能够在50天内使收益至少是本来的4倍。
GitHub完成
这是咱们的论文《ADeepReinforcementLearningFrameworkforpeFinancialPortfolioManagementProblem》的最新完成版别,还包括了Li和Hoi在总述论文中说到的一些其他出资组合办理算法。
深度强化学习结构是本库的中心。该办法的根底是即时奖赏上的梯度下降。你能够在独立的json文件中装备拓扑、练习办法或输入数据。练习进程将被记载,用户能够经过tensorboard看到练习进程。
更好的超参数优化需求成果摘要和并行练习。
出于比照的意图,本库还嵌入了根据金融模型的出资组合办理算法,其完成根据Li和Hoi的工具包OLPS。
论文版别差异
注:本库是咱们主项意图一部分,比arxivv2论文的完成高数个版别。
该版别修正了一些技能bug,对超参数和工程做了一些改善。
arxivv2论文中最大的bug是:论文说到的测验时间比实在的时间短30%。
运用新的超参数,用户能够快速练习模型。
论文后续版别将包括一切更新。
该开源版别不包括原始版别前史和内部评论。部分主意没有完成,或许成为咱们未来论文的根底,所以暂不发布。
渠道支撑
Windows体系:Pypon3.5+;Linux体系:Pypon2.7+/3.5+。
依靠项
经过pipinstall-rrequirements.txt装置依靠项
tensorflow(>=1.0.0)
tflearn
pandas
...
用户手册
链接
本文为机器之心编译,转载请联络本大众号取得授权。
------------------------------------------------
参加机器之心:hr@jiqizhixin
投稿或寻求报导:content@jiqizhixin
广告&商务协作:bd@jiqizhixin