请选择 进入手机版 | 继续访问电脑版
点击联系客服
客服QQ:509006671 客服微信:mengfeiseo

合肥老站长

 找回密码
 立即注册
查看: 6|回复: 0

[point wide column]基于深度学习的股票涨跌预测

[复制链接]

1

主题

1

帖子

-7

积分

限制会员

积分
-7
发表于 2021-5-17 13:24:37 | 显示全部楼层 |阅读模式
01背景

股价预测是学术界和业界一直研究的问题。影响股票价格的因素很多,涵盖上市公司基本面、产品价格的变动、国内宏观经济数据、国际市场各种金融资产和价格的变动等,各变量和股价的趋势呈非线性趋势,因此传统计量经济学模型不能很好地解决股价的预测问题。

近年来,人工智能和机器学习的出现为股价预测提供了新的思路,本文试图以深度学习的思想为基础预测上市公司的价格。

02深度学习理论与模式

深度学习是机器学习的新方向,其理论基础是神经网络。神经网络包含输入层、抑制层和输出层。可以将数据导入输入层,通过一系列的数据传导、计算和错误纠正来获得样本数据的唯一规则和表达层。理论上,足够复杂的神经网络可以访问任何函数。

2.1传感器

识别器是一种具有单层计算单元的神经网络,由线性分量和阈值分量组成。单层识别器的输入层和输出层之间添加隐藏层将构成多层识别器,每一层的计算由线性函数和非线性激活函数组成。神经网络包含深藏层”时,称为深度神经网络(DNN)。





2.2 RNN/LSTM

循环神经网络可以使用具有自身反馈(隐藏层)的神经元来处理任意长度的序列。循环神经网络比被级神经网络更符合生物神经网络的结构。RNN适合处理时间序列,也被广泛用于语音识别、图像处理、语言模型和自然语言生成等任务。

长时间存储器神经网络(LSTM)是循环神经网络的变体,可以有效地解决长期依赖问题/梯度消失问题。

本文利用LSTM建立了基于深度学习的股价涨跌预测模型。

03数据收集、处理和建模

3.1数据收集

本文从点宽BP因子数据库中获得了与心300成分股相关的基本面系数及技术面系数,共有149个因素,确保了2018年1月1日至2019年1月1日的时间区间。(威廉莎士比亚,《北方执行报》(Northern  Exposure))。





3.2数据处理和建模

由于沪深300组成股票的基本面系数和技术面系数数据之间的差异很大,因此需要规范化系数数据,对缺失值超过90%的删除处理,然后将剩余的缺失数据填充为零。

然后将数据分为训练集和测试集,按933601的比率除以,所有股票第二天的涨势除以输出,第二天上涨时除以1,否则除以0。使用其他基本元素和技术元素数据作为输入。

使用处理的数据构建LSTM模型。其中神经网络包括输入层、2层LSTM层和1个输出层。模型概述如下。

开始训练神经网络。





随着训练次数的增加,模特的损失率逐渐下降,准确度逐渐提高,最终可以达到92%以上。

3.3模型预测及改进方向

请注意,该LSTM模型在样本内预测效果很好,但使用该网络测试测试测试集的数据时,准确度只有53%。这意味着模型的实际应用效果比较一般。可以从以下两个方面进行补充:

数据:替换其他数据集以获得更多数据

调整神经网络的结构,使用其他类型的神经网络调整神经网络的参数
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|无图版|手机版|小黑屋|合肥@IT精英团

GMT+8, 2021-6-19 17:03 , Processed in 0.560930 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2021, Tencent Cloud.

快速回复 返回顶部 返回列表