跟我学AI量化交易(1)

AI百科3天前发布 快创云
3 0

  迈进2020年,无论是专业投资者还是准专业投资者,都需接触量化交易领域。随着A股市场逐步放开涨跌停限制,并计划将交易制度由T+1调整为T+0,投资者面临的交易环境正发生显著变化。新制度下,投资者决策时间被进一步压缩,程序化交易因此具备显著优势。即便是业余投资者,了解量化交易也显得尤为必要,因为随着量化交易平台的日益增多,率先涉足的投资者无疑将率先享受其带来的益处。

  本文旨在作为AI量化交易的入门教程,不仅探讨量化交易本身,更聚焦于如何利用最尖端的人工智能技术来解析市场波动,寻找与当前市场相契合的最优交易策略与模型。

  整个教程分为两大板块:第一部分聚焦于数据预处理,涵盖获取行情数据、本地存储、基础指标计算(如移动平均线、MACD等)及数据可视化。这部分内容构成量化交易的基础,无论是否采用AI技术均需掌握。

  第二部分则深入AI在交易策略学习中的应用。我们将从基础机器学习算法入手,利用sklearn库并展示经过验证的有效模型。随后,我们将踏入深度学习领域,借助PyTorch和FastAI构建算法模型,目前规划包括基于CNN和Transformer架构的神经网络模型。

  由于作者正构建自己的AI交易系统,所有代码示例均源自实战,确保教程内容实用且干货满满。此外,作者不仅精通编程,还具备超过十年的证券投资经验,因此本教程还将穿插丰富的证券交易实战经验分享,力求理论与实践相结合。

  此刻,夜色正浓,趁夜深人静,不妨加入这场AI量化交易的探索之旅!启程前,别忘了“购票”——关注本账号、转发或评论便是你的“上车”信号!

  构建交易系统时,精确且及时的数据至关重要。数据规模、实时性及市场归属需根据交易类型确定。高频交易虽为纳秒级,但在A股市场并不适用(受T+1及涨跌停限制影响);对于期货、数字货币或海外市场交易,高频交易才需考虑。本教程面向的读者主要是中低频交易者,即适用于A股市场的日线级别持仓时间。尽管部分内容也适用于分钟级别的可转债操作,但当前尚未找到理想的免费数据源。

  交易数据种类繁多,核心为行情数据。此外,中信多空单数据、北上资金流向数据、每周证券开户数据等也对市场产生显著影响,可能成为交易模型的重点关注对象。新闻消息类文本数据同样具有应用价值。例如,过去曾有公司借助资金炒作,通过投资者问答平台发布消息以拉升股价,尽管此类行为现已被打击。东方财富的股吧热度排名亦具参考价值,毕竟股价波动是资金投票的结果,唯有备受关注才能上涨。文本类数据主要通过爬虫技术获取。

  获取行情数据相对便捷,以下介绍三种方法:

  1. 使用pytdx:通达信作为主要的行情数据供应商及股票分析软件供应商,其协议被Pytdx纯Python实现所采纳,可兼容Windows和Linux系统。尽管今年百度网盘外挂事件后,Pytdx停止维护,但旧版本仍可使用。此工具可助你同时连接上百台服务器,以最快速度获取行情数据(仅限学习使用)。
  2. Tushare:包括Tushare和Tushare Pro两个版本。前者免费但已停止维护;后者虽无流量限制但收费。本教程主要使用聚宽出品的jqdatasdk作为数据源。申请该SDK需访问www.jointquant.com并注册账号。每个账号每天可免费获取100万条数据(实际上可能不够用)。

  接下来通过jqdatasdk获取行情数据的示例:

  上述代码将获取上证指数最近5天的行情数据。

  A股的T+1及涨跌停板制度曾是算法交易的重要限制因素。若将股价视为时间序列分布图来看这两大制度相当于在该序列中引入了突变与不连续性导致该序列不可微进而难以用传统数学方法分析。如今这两项限制即将取消而AI的发展使我们能够拟合几乎任何函数(即便是分段函数)因此现在是涉足该领域的绝佳时机。当然目前尚未出现对时间和突变特别敏感的神经网络现有神经网络并未考虑时间跨度它们认为时间是均匀流逝的或数据与时间无关但实际上股价在每个收盘和开盘之间都会受到消息的重大冲击如何让时间网络能够考虑这部分影响也是我们的研究方向之一。

© 版权声明

相关文章