阿里云 快来一起挖掘幸福感!项目实战

项目地址https://tianchi.aliyun.com/competition/entrance/231702/information

1,数据准备

问卷调查数据主要包含的个人信息有职业,婚姻状况,收入,学历等40个features,label就是幸福感。

首先对数据进行预处理

(一) 第二列是数据特征,先独立抽取出来。

(二) 第七列是时间,本身对结果影响不大,又由于是字符串,暂时删除不用。

(三) 数据本身包含20197个空缺,对数据进行补充。

2,训练和预测

给定的数据包含train和test两部分,先用train分成两部分对建立的模型进行训练评分,最后对test预测。

3,模型选择

通过对数据观察,选择经典的决策树模型来对数据进行处理。下面是代码(模型)

clf = tree.DecisionTreeClassifier(criterion = 'entropy', random_state = 30, max_features ='log2', splitter = 'random', max_depth = 7, min_samples_leaf = 10, min_samples_split = 70 )
score = clf.fit(X_train, y_train)
predict_test_y = clf.predict(X_test0)
imp = clf.feature_importances_res = clf.predict(Xtrans_test)

机器学习算法(十) 根据幸福感问卷调查做预测相关推荐

  1. 机器学习算法:根据幸福感问卷调查做预测

    阿里云 快来一起挖掘幸福感!项目实战 项目地址 1,数据准备 问卷调查数据主要包含的个人信息有职业,婚姻状况,收入,学历等40个features,label就是幸福感. 首先对数据进行预处理 (一) ...

  2. 【玩转数据系列十三】机器学习算法基于信用卡消费记录做信用评分

    原文链接 机器学习算法基于信用卡消费记录做信用评分 背景 如果你是做互联网金融的,那么一定听说过评分卡.评分卡是信用风险评估领域常用的建模方法,评分卡并不简单对应于某一种机器学习算法,而是一种通用的建 ...

  3. 【机器学习PAI实践十二】机器学习算法基于信用卡消费记录做信用评分

    背景 如果你是做互联网金融的,那么一定听说过评分卡.评分卡是信用风险评估领域常用的建模方法,评分卡并不简单对应于某一种机器学习算法,而是一种通用的建模框架,将原始数据通过分箱后进行特征工程变换,继而应 ...

  4. 【Java应用】使用Java实现机器学习算法:聚类、分类、预测

    一.引言 1.机器学习算法概述 机器学习是一种人工智能技术,旨在通过使用数据和统计分析来让计算机系统自动改进性能.机器学习算法可分为三大类:聚类.分类和预测.聚类算法用于将数据集分成不同的群组:分类算 ...

  5. 基于Python机器学习算法的电影推荐系统以及票房预测系统

    电影数据分析 目录 电影数据分析 1 一..实验概述 1 1.1 实验标 1 1.2 .实验完成情况 1 二..电影特征的可视化分析 2 电影票房预测 9 2.1 Data Augmentation ...

  6. Briefings in Bioinformatics|南开大学药学院林建平教授|用于天然产物靶标预测的机器学习算法的大规模比较

    今天我们来学习南开大学药学院林建平教授(学科方向:计算生物学)2022年发表在Briefings in Bioinformatics上的新作"用于天然产物靶标预测的机器学习算法的大规模比较& ...

  7. 用于预测脊柱转移术后30天死亡率的机器学习算法的开发

    用于预测脊柱转移术后30天死亡率的机器学习算法的开发 Development of Machine Learning Algorithms for Prediction of 30-Day Morta ...

  8. 机器学习算法的优缺点

    决策树 一.  决策树优点 1.决策树易于理解和解释,可以可视化分析,容易提取出规则. 2.可以同时处理标称型和数值型数据. 3.测试数据集时,运行速度比较快. 4.决策树可以很好的扩展到大型数据库中 ...

  9. python算法的缺陷和不足_机器学习算法优缺点及其应用领域

    决策树 一.  决策树优点 1.决策树易于理解和解释,可以可视化分析,容易提取出规则. 2.可以同时处理标称型和数值型数据. 3.测试数据集时,运行速度比较快. 4.决策树可以很好的扩展到大型数据库中 ...

  10. 最实用的机器学习算法优缺点分析,没有比这篇说得更好了

    AI技术年度盛会即将开启!11月8-9日,来自Google.Amazon.微软.Facebook.LinkedIn.阿里巴巴.百度.腾讯.美团.京东.小米.字节跳动.滴滴.商汤.旷视.思必驰.第四范式 ...

最新文章

  1. 红帽RHCE培训-课程3笔记目录
  2. 2017(深圳) .NET技术分享交流会(第二期)网络直播活动
  3. Android之BaseQuickAdapter(3.0.4版本)给子view添加点击事件(helper.addOnClickListener(view))的函数没了
  4. ELK-filbeate收集tomcat日志
  5. struts2从form取值的三种方式
  6. iframe 滚动条不显示_BUG赏金 | 当我发现iFrame注入时的利用
  7. 孙鑫VC学习笔记:第十一讲 (三) 如何把元文件保存到文件当中
  8. Clover 引导 Windows 及 Linux 双系统
  9. MS08067红队攻防第三期 今晚7点 不见不散~
  10. 成功解决 遇到3dmax模型文件出错,找回并修复出错文件
  11. JAVA怎么给Excel加分页符_Excel插入分页符的方法和步骤
  12. 微信小程序接口服务器,微信小程序--调用外部服务器接口
  13. Windows10 无法使用内置管理员打开照片问题解决
  14. QQ商家(QQ在线咨询,QQ推广等)
  15. Js(二)SyntaxError Cannot use import statement outside a module
  16. 弘辽科技:拼多多没出单改销量吗?拼多多如何提高销量?
  17. bedtools 批量提取snp前后1000bp片段
  18. 基于CNN 对车牌数字进行识别,(二)
  19. CSU 1596: Dick.Z 的炉石赛(模拟)
  20. 微信小程序联盟:官方文档+精品教程+demo集合(未完待续,持续更新中……)

热门文章

  1. SpringCloud之服务提供者和服务消费者
  2. 一年级上册计算机教学计划,一年级信息技术上册教学计划
  3. 一元享移动怎么样_移动新套餐:18元享“全免流”+1元1G流量,阿里鱼卡要遭殃?...
  4. Oracle启动监听错误TNS-12555: TNS:permission denied
  5. Miracast协议
  6. 帝国php改密码后登录不进去,帝国CMS安装,后台,登陆,密码常见问题汇总
  7. Hunger Snake 2
  8. 2022年第七届IEEE云计算与大数据分析国际会议
  9. 火狐Android 附加组件,Android版Firefox 85允许AMO安装附加组件
  10. 计算机网络运行管理,计算机网络管理规定