今天进行SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析的第三部分,对bi关联数据进行数据分析,通过知识准备中的身高预测模型,我们可以了解数据挖掘的定义,和基础的分类算法原理。

1.知识准备

数据挖掘就是将这种科学应用到生活中,也就是各种指数。例如:裙边理论:女性的裙子长度可以反映经济的兴衰,裙子越短,经济发展情况越好,裙子越长,经济发展情况越艰险。另外,还有德国啤酒指数:每当气温上升1度,啤酒销量就平均增加230万瓶,这就是“德国啤酒指数”;空调指数:在日本夏季,温度每上升1度,空调的销量就平均增加30万台。

这些行业指数都是统计学在某一方面的应用。当然,现在的统计学已经大大超出了行业指数研究的范畴。例如IBM在医疗领域利用Watson技术解决了包括糖尿病、白内障、肿瘤等难题。但是,无论是在过去、现在还是未来,人们总是希望能够借助观察事物(获取数据),通过合适的手段(建立统计挖掘模型)来量化这些关系。例如,借助一个人的身高来预测他的体重。

身高预测模型

上图是一个统计挖掘模型的基本形式。简单来说,统计挖掘模型是指利用一个或多个输入变量(一般也被称为自变量)通过拟合适当的关系式来预测目标变量(也被称为因变量)的方法。其中,f(x)是我们探求的关系式,但是其一般是固定并且未知的。尽管f(x)未知,但是我们的目标是利用一系列的统计/挖掘方法来尽可能求出接近f(x)的模型,这种模型可以是一个简单的线性回归模型y=ax+b,也可能是一个曲线模型y=a+bx²,当然也有可能是一个神经网络模型或者一个决策树模型。

这些模型从预测任务的角度看,估计出f(x)的形式并不意味着任务结束,在实际的商业实践中,可以将数据挖掘任务简单分为预测任务与控制任务。

(1)预测任务:我们关心的是目标变量Y的预测。预测模型f(x)的形式有可能是一个黑箱模型(即对于模型本身,我们不能很好解释或者并不清楚其内部结构,而是更加关心模型的输入和输出),只要能够提高预测精度,我们就认为达到目的了。一般,神经网络模型属于典型的黑箱模型。例如:Google X实验室开发出具有自主学习能力的神经网络模型,它能够从1000万张图片中找出那些有小猫的照片,其中,这1000万张图片就是输入,对于这些图片的识别就是输出。

(2)控制任务:在控制任务中,我们希望能够尽可能地描述清楚X与Y的关系。例如在金融行业,要通过客户的个人信用信息来评价个人的信用风险,这就要求模型不但能够回答这个客户的信用风险是高还是低,还要能回答哪些因素直接影响客户的信用风险,每个因素的影响程度有多大。

2.顾客购买理财产品目的及选择本行的原因

从上面两个散点图分别表示所有顾客及亏损的顾客购买理财产品目的与选择本行的关系。从中可以看出数据分布特点为:绝大多数购买目的为“长期资产保值增值”和“合理安排资金、分担风险”的顾客及亏损顾客选择本行原因为“预期年化收益率高”。两组数据存在比较明显差异,说明购买目的与选择本行原因对于亏损存在较大影响。

3.各类理财产品购买情况

从上面两个气泡图分别表示所有顾客及亏损的顾客购买各类理财产品的情况。两图差异较小可以说明理财产品选择的种类对于亏损影响不大。从中可以看出数据分布特点为:

(1)所有顾客中绝大多数顾客购买银行类理财产品,其他理财产品的购买数量均匀分布。

(2)绝大多数亏损顾客也倾向于购买银行类理财产品,其次购买数量较多的是银行活期存款、外汇、基金、国债和股票。说明购买银行理财产品、外汇、基金、国债和股票具有一定的风险,其中购买银行理财产品的风险较大。

4.顾客风险偏好属性

从上面两个柱状图分别表示所有顾客及亏损的顾客的风险偏好属性。从中可以看出数据分布特点为:不同风险偏好属性的顾客数量与总体的顾客数量分布一致——均为偏好中风险受益的顾客人数最多,其次是偏好低风险收益的顾客人数。说明风险偏好属性对于亏损影响并不大。

以上的数据可视化图表属于关联图表,并没有实现仪表板设置,我们也可以将图表导入仪表板通过帆软finebi实现仪表板设置,让数据可视化分析更加完整。

三.SPSS+finebi实现基于分类算法的理财产品顾客亏损及收益分析相关推荐

  1. 【python代码实现】人工神经网络分类算法及其实战案例(股票价格波动分析)

    目录 前置知识 1.前言 2.人工神经网络模型 2.1.神经元模型与单层神经网络 2.2.多层人工神经网络模型 人工神经网络分类算法 1.构建数据集 2.响应函数 3.模型训练 4.测试样本分类 案例 ...

  2. 基于分水岭算法和机载激光雷达点云三维空间分布分析的单棵树分割方法

    Paper题目:An Individual Tree Segmentation Method Based on Watershed Algorithm and Three-Dimensional Sp ...

  3. 《基于slam算法的超视距小车》调研分析报告

    本项目是博主在本科期间和同学一起制作的一个实训项目,关键代码以后会放出. 这是我们测试的视频 项目背景分析 机器人曾经是科幻电影中的形象,可目前已经渐渐走入我们的生活.机器人技术以包含机械.电子.自动 ...

  4. [Python从零到壹] 十四.机器学习之分类算法五万字总结全网首发(决策树、KNN、SVM、分类对比实验)

    欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...

  5. 情感分析的分类,情感分析模型有哪些,情感分析的应用场景,情感分析的发展趋势

    1.情感分析的分类: (1)基于情感极性的分类:将文本的情感分为正向.负向和中性三类. (2)基于情感维度的分类:将文本的情感分为喜欢.愤怒.悲伤.惊喜等多个情感维度. 2.情感分析模型: (1)基于 ...

  6. 基于协同训练的半监督文本分类算法

    标签: 半监督学习,文本分类 作者:炼己者 --- 本博客所有内容以学习.研究和分享为主,如需转载,请联系本人,标明作者和出处,并且是非商业用途,谢谢! 如果大家觉得格式看着不舒服,也欢迎大家去看我的 ...

  7. 基于机器学习和TFIDF的情感分类算法,详解自然语言处理

    摘要:这篇文章将详细讲解自然语言处理过程,基于机器学习和TFIDF的情感分类算法,并进行了各种分类算法(SVM.RF.LR.Boosting)对比 本文分享自华为云社区<[Python人工智能] ...

  8. [转载] python机器学习第三章:使用scikit-learn实现机器学习分类算法

    参考链接: 使用Scikit-Learn在Python中进行embedding/投票分类 训练机器学习算法所涉及的五个主要步骤可以概述如下: 1.特征的选择 2.确定性能评价标准 3.选择分类器及其优 ...

  9. 随机森林实例:利用基于CART算法的随机森林(Random Forest)树分类方法对于红酒质量进行预测

    随机森林实例:利用基于CART算法的随机森林(Random Forest)树分类方法对于红酒质量进行预测 1.引言 2.理论基础 2.1 什么是决策树 2.2 特征选择的算法 2.2.1 ID3:基于 ...

最新文章

  1. go语言中fmt包中Print、Printf、Println输出相关函数的区别
  2. 图的概念以及常见的图论问题介绍
  3. MySQL删除匿名用户,保证登录安全
  4. 010——VUE中使用lodash库减少watch对后台请求的压力
  5. 【Unity3D基础教程】给初学者看的Unity教程(四):通过制作Flappy Bird了解Native 2D中的RigidBody2D和Collider2D...
  6. 经典笔试题: 二叉树中和为某一值的路径(路径总和)
  7. insert时调用本身字段_MySQL RC级别下并发insert锁超时问题 - 案例验证
  8. Freemarker模板引擎
  9. mysql中ibdata1过大的问题
  10. HDC.Cloud2021|开发者们都在谈的云原生到底长什么样?
  11. web前端顶岗实习总结报告_实习报告-web前端实习报告范文三篇 精品
  12. 安卓手机利用DroidCam当电脑摄像头使用方法
  13. Mac下最好用的离线词典-欧陆词典破解版
  14. SOLIDWORKS Composer制作动画的方法
  15. ai的预览模式切换_ai预览快捷键是什么,Adobe Illustrator预览快捷键是什么?
  16. python getch函数_pyhton 下 使用getch(), 输入字符无需回车
  17. 基于 SpringBoot+Vue 的开源数据可视化分析工具
  18. Friendship of Frog
  19. 大数据领域各职业介绍与发展路线
  20. python os.system_python中os.system()的返回值

热门文章

  1. 机器视觉标定(calibration)关键尝试(标定的重要意义度量衡)(A)
  2. 数据库———数据查询
  3. Mysql 计算时间差、按条件求和、计算百分比
  4. 亏损?盈利?禾赛科技Q1财报背后的激光雷达赛道「现实」
  5. Win11解决需要使用新应用以打开此WindowsDefender链接
  6. SCAU 9502 ARDF
  7. js判断是否为移动端
  8. 基于Canvas的九宫格抽奖,就是仿csdn的APP做的,能过审不?
  9. 基于ATmega32的SD卡上FAT32文件系统数据读取
  10. 做个人网站的一些心得体会