泰迪智能科技(TipDM数据挖掘平台)最新推出的数据挖掘实战专栏

专栏将数据挖掘理论与项目案例实践相结合,可以让大家获得真实的数据挖掘学习与实践环境,更快、更好的学习数据挖掘知识与积累职业经验

专栏中每四篇文章为一个完整的数据挖掘案例。案例介绍顺序为:先由数据案例背景提出挖掘目标,再阐述分析方法与过程,最后完成模型构建,在介绍建模过程中同时穿插操作训练,把相关的知识点嵌入相应的操作过程中。

为方便读者轻松地获取一个真实的实验环境,本专栏使用大家熟知的Python语言对样本数据进行处理以进行挖掘建模。
————————————————
下面进入最终篇,上机实验及拓展思考~

实验目的

(1) 掌握Lasso回归特征选择。

(2) 构建灰色预测与神经网络预测模型。

实验内容

(1) 对搜集的某市地方财政收入以及各类别收入数据,分析识别影响地方财政收入的关键属性,数据详见:test/data/data.csv。

(2) 预测筛选出的关键影响因素的2014年、2015年的预测值。

(3) 使用关键影响因素的2014年、2015年的预测值得到某市地方财政收入2014年、2015年的预测值。

实验方法与步骤

(1) 将“data.csv”数据使用pandas库中的read_csv函数读入当前工作空间。

(2) 使用scikit-learn中的Lasso函数对数据进行属性选择。

(3) 使用GM(1,1)灰色预测方法得到筛选出的关键影响因素的2014年、2015年的预测值。

(4) 使用支持向量回归模型对某市地方财政收入进行预测。

思考与实验总结

(1) Lasso回归如何设置合适的l值,在保证能够选取关键属性的前提下不过多的增加Lasso回归的复杂程度?

(2) 在构建SVR预测模型前使用标准差标准化对数据进行标准化处理,如使用其他标准化处理方法对结果又会造成怎么样的影响?

拓展思考

MLP多层感知器(Multi-layerPerceptron)是一种前向结构的人工神经网络ANN,映射一组输入向量到一组输出向量。MLP可以被看做是一个有向图,由多个节点层组成,每一层全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元。使用BP反向传播算法的监督学习方法来训练MLP。MLP是感知器的推广,克服了感知器不能对线性不可分数据进行识别的弱点。

相对于单层感知器,MLP多层感知器输出端从一个变到了多个;输入端和输出端之间也不光只有一层,现在有两层:输出层和隐藏层,如图1-1所示。

图 1-1多层感知器

MLP多层感知器是前馈神经网络的一个例子,一个前馈神经网络可以包含三种节点。

1) 输入节点(Input Nodes):也称为输入层,输入节点从外部世界提供信息。在输入节点中,不进行任何的计算,仅向隐藏节点传递信息。

2) 隐藏节点(Hidden Nodes):隐藏节点也称为隐藏层,和外部世界没有直接联系,这些节点进行计算,并将信息从输入节点传递到输出节点。尽管一个前馈神经网络只有一个输入层和一个输出层,但网络里可以没有也可以有多个隐藏层。

3) 输出节点(Output Nodes):输出节点也称为输出层,负责计算,并从网络向外部世界传递信息。

在前馈网络中,信息只单向移动——从输入层开始前向移动,然后通过隐藏层,再到输出层。在网络中没有循环或回路。

MLP在80年代的时候曾是相当流行的机器学习方法,拥有广泛的应用场景,譬如语音识别、图像识别、机器翻译等等,但自90年代以来,MLP遇到来自更为简单的支持向量机的强劲竞争。近来,由于深层学习的成功,MLP又重新得到了关注。

MLP拥有高度的并行处理、高度的非线性全局作用、良好的容错性、具有联想记忆功能、非常强的自适应、自学习功能等优点。但是MLP的网络的隐含节点个数选取非常难,停止阈值、学习率、动量常数需要采用“trial-and-error”法,极其耗时,学习速度慢并且容易陷入局部极值。

使用MLP算法实现对本案例的财政收入预测,并与支持向量机回归模型的预测效果进行对比。

财政收入影响因素分析及预测模型实战案例至此结束,前三篇文章链接在

数据挖掘实战分享:财政收入影响因素分析及预测(四)相关推荐

  1. python数据分析与挖掘实战(财政收入影响因素分析及预测)

    导言 随着信息化的发展和科学技术的进步,数据分析与挖掘技术开始得到广泛应用.人们无时无刻不面对着海量的数据,这些海量数据中隐藏着人们所需要的具有决策意义的信息.数据分析与挖掘技术的产生和发展就是帮助人 ...

  2. 数据挖掘实战分享:财政收入影响因素分析及预测(二)

    泰迪智能科技(TipDM数据挖掘平台)最新推出的数据挖掘实战专栏 专栏将数据挖掘理论与项目案例实践相结合,可以让大家获得真实的数据挖掘学习与实践环境,更快.更好的学习数据挖掘知识与积累职业经验 专栏中 ...

  3. 数据挖掘实战分享:财政收入影响因素分析及预测(一)

    泰迪智能科技最新推出的数据挖掘实战专栏 专栏将数据挖掘理论与项目案例实践相结合,可以让大家获得真实的数据挖掘学习与实践环境,更快.更好的学习数据挖掘知识与积累职业经验 专栏中每四篇文章为一个完整的数据 ...

  4. 【项目实战】Python基于Lasso特征选择、GM算法和SVR回归算法进行财政收入影响因素分析及预测

    说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 1.项目背景 随着信息化的发展和科学技术的进步,数据分析与挖掘技术开始得到广泛 ...

  5. 财政收入影响因素分析及预测

    一.项目概述 数据来源:网络上自找的数据百度云盘链接:https://pan.baidu.com/s/1Lmhl34BumjBloN-rhy7Yqw 提取码:z84d 项目背景:地方财政收入,是指政府 ...

  6. python财政收入预测分析_Python:Lasso方法、GM预测模型、神经网络预测模型之财政收入影响因素分析及预测...

    问题重述 通过研究,发现影响某市目前及未来地方财源的因素.结合文中目标:(1)选择模型,找出影响财政收入的关键因素:(2)基于关键因素,选择预测方法.模型预测未来收入. 具体来讲 本文分析了地方财政收 ...

  7. 【深度学习实验】第二次:Python财政收入影响因素分析及预测

    相关知识 设变量 X ( 0 ) = { X ( 0 ) ( i ) , i = 1 , 2 , . . . , n

  8. 数据分析与挖掘:财政收入影响因素分析及预测模型

    财政收入影响因素分析及预测模型 1. 背景与挖掘目标 2. 分析方法与过程 2.1 数据探索 2.2 模型构建 2.3 数据预测 1. 背景与挖掘目标 项目为<Python 数据分析与挖掘实战& ...

  9. 10 财政收入影响因素分析及预测模型

    4 10 财政收入影响因素分析及预测模型 10.1背景与挖掘目标 本案例通过研究发现影响目前以及未来地方财源建设的因素,并对其进行深入分析,提出对该市地方财源优化的具体建议,供政府决策参考,同时为其他 ...

最新文章

  1. Python 如何查看内存地址
  2. android dslr控制软件,DSLR Controller
  3. 华为如何拍火烧云_华为手机拍照功能介绍-设置通用功能
  4. jquery data()
  5. jboss fuse 教程_IDC关于使用JBoss Fuse的商业价值的报告(与Apache Camel一起使用)
  6. 之前接触过的测试的相关工具
  7. mysql参数配置调优详解配置(1)
  8. linux开源镜像站 目录帮助,LinuxEye开源镜像站运营
  9. 三个数据分析里最难攻破的“悖论”,每一个都令人费解
  10. 台积电南京12寸厂址 落脚江北新区
  11. MCMC算法大统一: Involutive MCMC
  12. 软件系统设计基本原则
  13. Modbus协议中文pdf免费下载地址
  14. TrueCrypt最好用的加密软件
  15. python数据分析002—python基础语法
  16. C++ string常用截取字符串方法
  17. SAP QM检验批常见问题及解决办法
  18. 大数据人工智能实验室-大数据培训方案
  19. MVC框架的学习总结
  20. APP进行微信分享,提示签名不一致解决方案

热门文章

  1. python与erp_Python-EEG处理和事件相关电位(ERP)
  2. 说说System Workflow和Human Workflow
  3. 人脸伪造DFDC数据集下载 附网盘地址
  4. 泰山OFFICE技术讲座:页面空白(页边距)是怎么算的
  5. group by 后面 order by 失效问题
  6. 阴阳师ios和android,阴阳师:国际服已经可以IOS和安卓系统转换了,国服还遥遥无期...
  7. 工厂应该如何批量打印送货单和产品标签
  8. PendingIntent重定向:一种针对安卓系统和流行App的通用提权方法——BlackHat EU 2021议题详解 (下)
  9. 如何在 openSUSE上安装和启用 SSH 服务器
  10. websocket接口自动化集成pytest测试框架详解