A股上市公司营收预测

  • 前言
  • 背景
  • 人员介绍
  • 数据理解
  • 数据准备
    • 翻译利润表的变量名(吃了文化亏)
    • 通过spss statistisc的自动线性建模分析出影响到营业收入的10个变量
  • 建模(乱建的模)
  • 模型评估
  • 部署

前言

这是我第一次写博客,也是第一次用 Markdown编辑器。主要用于记录项目思路和笔记吧,不足之处还请指正
这篇估计要写几天,因为一边看机器学习的书,这几天会一点一点写完

背景

在金融领域,每24小时都会产生大约2.5亿字节的数据,早已超过人脑处理的极限,面对全球百万亿美元的资产管理规模,行业迫切需要人工智能的加入,提升行业运行效率,让投资变得更加智能

这个题目是天池大赛的题目,看了大佬们的答辩视频的笔录,因为看不懂公式,所以只做了个乞丐版。

实现了简单线性预测,用到三种方法:

  • 神经网络测出重要变量
  • 决策树调整自变量能控制因变量(其实还是不太理解)
  • 线性回归预测营收

人员介绍

四个人

数据理解

财务数据和营业收入是成相关的
Q1季报
S1半年报
Q3前三季
A全年

一般来说,把单个季度作为单位预测回更加准确一些

复赛大佬的PPT截图:

数据准备

翻译利润表的变量名(吃了文化亏)


表需要转成xlsx才能导入spss
字典里面多了5个变量,删除了这些变量:
数据来源 公告id 实际纰漏时间 会计准则 货币代码

某大佬说空值填0,这样不会影响内在的等式关系。不过最后没有填0,因为删去了很多变量

通过spss statistisc的自动线性建模分析出影响到营业收入的10个变量


工商利润表


银行


保险


证券

建模(乱建的模)

负责建模组员的原话

建模流程:
理解问题–>数据的处理–>数据挖掘的执行–>分析影响公司营业收入的因素–>取出个别公司进行营收预测
开始实施:
这次的建模主要使用到了3个模型,一个是类神经网络,主要用了预测变量的重要性和一个走势,二是决策树,决策树也是可以预测变量和影响营业收入的因素,给公司提供一个合理的改进计划,三是时间序列,用于预测下一年的营业收入,和一个季度涨幅走势


分区是用于每一只股的分类,来进行一个训练和培养,最后对训练出来的模型进行一个分析


类神经网络

将目标设置为营业收入
把不影响营业收入的变量剔除出来
在神经网络看来归属于母公司所有者或股东的净利润是对营业收入最重要
可以看出营业收入和自变量属于一个正相关的关系




CART决策树




业务及管理费用<=6.e10有92.9%是盈利的
营业支出<=2.1e10有74.7%盈利的
业务及管理费用>6.e10有7.01%是亏损的
可以知道CART决策树可以,给公司的收入提出一个合理的改进计划,改变公司的营业收入


时间序列

选择日期,选择时间间隔 季度

选择要输出的模型,图表

可以预测出根据之前的一个年份预测出2019年的Q1 Q3的一个走势可以看得出2019的的营业收入会比之前的都高

预测出的未来值,因为有个大量的数据,而且报告类型,都是季度的,若要让数值的准确度更加高,我们将取两只股会到下面的评估进来一个细致的预测

模型评估

部署

A股上市公司营收预测相关推荐

  1. 阿里天池竞赛 A股上市公司营收预测 使用LSTM模型做时序预测

    参赛结束了,最后结果一百多名,先把清洗好的数据和预测算法文件记录下来. 使用的完全代码和数据 https://download.csdn.net/download/infent/10693927 代码 ...

  2. 竞赛资讯|A股上市公司季度营收预测

     (本内容转载自公众号"科技与Python") A股上市公司季度营收预测 大赛背景 在金融领域,每24小时都会产生大约2.5亿字节的数据,早已超过人脑处理的极限,面对全球百万亿美元 ...

  3. 实战A股上市公司季度营收预测

    1. 说明  FDDC2018金融算法挑战赛01-A股上市公司季度营收预测,是天池最近的一个算法比赛,7月15是初赛提交的deadline,就最后两天了,也没法做得太细,看看怎么用最短的时间,抓住最关 ...

  4. access游戏库不显示 ea_全球游戏公司营收一览:腾讯连续第六年霸榜

    对于腾讯来说,他们主力营收还是来自游戏,这点是毋庸置疑的. 市场研究公司Newzoo送出的最新报告显示,2018年排名前25的上市游戏公司,总营收首次超过1000亿美元(1073亿美元),而全球市场的 ...

  5. 2021年三季度中国物流行业A股上市企业营收排行榜:*ST飞马于12月初成功摘星脱帽(附热榜TOP46详单)

    榜单解读: 2021年三季度中国物流行业共有46家(截至2022年2月8日)A股上市企业披露三季报,总计营收23859.1亿元,同比增长89.33%(2020Q3共有44家物流上市企业),总计归属母公 ...

  6. 蔚来汽车哭诉没钱赚,大宗商品成本上升,下调第二季度营收预测,

    中国电动汽车制造商蔚来汽车今天公布了截至2022年3月31日的第一季度财务业绩,亏损额同比增长295.3%至2.812亿美元. 本季度总收入为99亿美元(15.6亿美元),同比增长24.2%,比202 ...

  7. Commvault公司营收增长 但本季度仍身陷亏损

    Commvault公司已经连续第三季度实现业务复苏,不过其税后实际收益较上年同期仍然出现了更加严重的亏损状况. Commvault公司2017财年第一季度营收同比提升9.6%,达到1.524亿美元:上 ...

  8. 2021年三季度中国医疗服务行业A股上市企业营收排行榜:国际医学于1月17日起戴帽,简称变更为“ST国医”(附热榜TOP37详单)

        榜单解读: 2021年三季度中国医疗服务行业共有37家(截至2022年1月17日)A股上市企业披露三季报,总计营收944.7亿元,同比增长83.31%(2020Q3共有24家医疗服务上市企业) ...

  9. 2021年三季度中国家居用品行业A股上市企业营收排行榜:欧派家居、顾家家居排名前2位,且近五年第三季度的净利润均逐年递增(附热榜TOP61详单)

        榜单解读:     2021年三季度中国家居用品行业共有61家(截至2022年1月19日)A股上市企业披露三季报,总计营收1576亿元,总计归属母公司净利润142.3亿元.61家家居用品上市企 ...

最新文章

  1. js onclick方法
  2. 中等数学类杂志投稿信箱
  3. 前端学习(2835):小程序中使用less
  4. oracle数据库领域,菜鸟成长课程之《Oracle数据库职业直通车》,引领大家真正进入Oracle数据库领域...
  5. win7硬盘安装工具_如何重装电脑安装Win7 系统?最简单,最便捷的办法,值得收藏...
  6. Qt笔记-QSerialPort的使用(串口通信简单实例)
  7. SenchaTouch2.3.1 中使用listpaging以及pullrefresh插件 做的分页示例
  8. ASP.net控件开发系列之(一、二)
  9. linux gdb检查函数栈,Linux - gdb调试
  10. Hyper-V网络虚拟化--VM之间拷贝速度慢
  11. Atitit. Object-c语言 的新的特性  attilax总结
  12. Citrix 桌面云 XenApp_XenDesktop_7.18 部署
  13. 新版php卡盟排行榜网站源码
  14. java.sql.SQLException: Parameter index out of range (2 」 number of parameters, which is 1).
  15. python中ix用法_在python的pandas模块中,DataFrame对象,如何选择一行?索引、loc、iloc、ix的用法及区别...
  16. 微信支付服务商接入指引
  17. 使用Python爬虫自动爬取沪港通每日持股数据
  18. OpenKruise :SidecarSet 助力 Mesh 容器热升级,TCP的三次握手、四次挥手
  19. Gradle同步工程下载依赖慢
  20. Python文件读写代码

热门文章

  1. MPU6050专用稳压模块的原理图设计
  2. 流式细胞仪荧光补偿调节方法
  3. 非结构化数据治理方案
  4. Postman一个接口多次循环调用
  5. 《程序员之禅》一一1.2 什么是禅
  6. 腾讯云的短信验证功能实现
  7. 基于STM32单片机的智能书桌设计与实现
  8. 光场相机 light field camera
  9. 如何进行Mac格式化恢复操作
  10. 计算机的软盘有没有磁性材料,磁性材料竟然还有如此惊人的历史!