机器学习算法(十) 根据幸福感问卷调查做预测
阿里云 快来一起挖掘幸福感!项目实战
项目地址https://tianchi.aliyun.com/competition/entrance/231702/information
1,数据准备
问卷调查数据主要包含的个人信息有职业,婚姻状况,收入,学历等40个features,label就是幸福感。
首先对数据进行预处理
(一) 第二列是数据特征,先独立抽取出来。
(二) 第七列是时间,本身对结果影响不大,又由于是字符串,暂时删除不用。
(三) 数据本身包含20197个空缺,对数据进行补充。
2,训练和预测
给定的数据包含train和test两部分,先用train分成两部分对建立的模型进行训练评分,最后对test预测。
3,模型选择
通过对数据观察,选择经典的决策树模型来对数据进行处理。下面是代码(模型)
clf = tree.DecisionTreeClassifier(criterion = 'entropy', random_state = 30, max_features ='log2', splitter = 'random', max_depth = 7, min_samples_leaf = 10, min_samples_split = 70 )
score = clf.fit(X_train, y_train)
predict_test_y = clf.predict(X_test0)
imp = clf.feature_importances_res = clf.predict(Xtrans_test)
机器学习算法(十) 根据幸福感问卷调查做预测相关推荐
- 机器学习算法:根据幸福感问卷调查做预测
阿里云 快来一起挖掘幸福感!项目实战 项目地址 1,数据准备 问卷调查数据主要包含的个人信息有职业,婚姻状况,收入,学历等40个features,label就是幸福感. 首先对数据进行预处理 (一) ...
- 【玩转数据系列十三】机器学习算法基于信用卡消费记录做信用评分
原文链接 机器学习算法基于信用卡消费记录做信用评分 背景 如果你是做互联网金融的,那么一定听说过评分卡.评分卡是信用风险评估领域常用的建模方法,评分卡并不简单对应于某一种机器学习算法,而是一种通用的建 ...
- 【机器学习PAI实践十二】机器学习算法基于信用卡消费记录做信用评分
背景 如果你是做互联网金融的,那么一定听说过评分卡.评分卡是信用风险评估领域常用的建模方法,评分卡并不简单对应于某一种机器学习算法,而是一种通用的建模框架,将原始数据通过分箱后进行特征工程变换,继而应 ...
- 【Java应用】使用Java实现机器学习算法:聚类、分类、预测
一.引言 1.机器学习算法概述 机器学习是一种人工智能技术,旨在通过使用数据和统计分析来让计算机系统自动改进性能.机器学习算法可分为三大类:聚类.分类和预测.聚类算法用于将数据集分成不同的群组:分类算 ...
- 基于Python机器学习算法的电影推荐系统以及票房预测系统
电影数据分析 目录 电影数据分析 1 一..实验概述 1 1.1 实验标 1 1.2 .实验完成情况 1 二..电影特征的可视化分析 2 电影票房预测 9 2.1 Data Augmentation ...
- Briefings in Bioinformatics|南开大学药学院林建平教授|用于天然产物靶标预测的机器学习算法的大规模比较
今天我们来学习南开大学药学院林建平教授(学科方向:计算生物学)2022年发表在Briefings in Bioinformatics上的新作"用于天然产物靶标预测的机器学习算法的大规模比较& ...
- 用于预测脊柱转移术后30天死亡率的机器学习算法的开发
用于预测脊柱转移术后30天死亡率的机器学习算法的开发 Development of Machine Learning Algorithms for Prediction of 30-Day Morta ...
- 机器学习算法的优缺点
决策树 一. 决策树优点 1.决策树易于理解和解释,可以可视化分析,容易提取出规则. 2.可以同时处理标称型和数值型数据. 3.测试数据集时,运行速度比较快. 4.决策树可以很好的扩展到大型数据库中 ...
- python算法的缺陷和不足_机器学习算法优缺点及其应用领域
决策树 一. 决策树优点 1.决策树易于理解和解释,可以可视化分析,容易提取出规则. 2.可以同时处理标称型和数值型数据. 3.测试数据集时,运行速度比较快. 4.决策树可以很好的扩展到大型数据库中 ...
- 最实用的机器学习算法优缺点分析,没有比这篇说得更好了
AI技术年度盛会即将开启!11月8-9日,来自Google.Amazon.微软.Facebook.LinkedIn.阿里巴巴.百度.腾讯.美团.京东.小米.字节跳动.滴滴.商汤.旷视.思必驰.第四范式 ...
最新文章
- 红帽RHCE培训-课程3笔记目录
- 2017(深圳) .NET技术分享交流会(第二期)网络直播活动
- Android之BaseQuickAdapter(3.0.4版本)给子view添加点击事件(helper.addOnClickListener(view))的函数没了
- ELK-filbeate收集tomcat日志
- struts2从form取值的三种方式
- iframe 滚动条不显示_BUG赏金 | 当我发现iFrame注入时的利用
- 孙鑫VC学习笔记:第十一讲 (三) 如何把元文件保存到文件当中
- Clover 引导 Windows 及 Linux 双系统
- MS08067红队攻防第三期 今晚7点 不见不散~
- 成功解决 遇到3dmax模型文件出错,找回并修复出错文件
- JAVA怎么给Excel加分页符_Excel插入分页符的方法和步骤
- 微信小程序接口服务器,微信小程序--调用外部服务器接口
- Windows10 无法使用内置管理员打开照片问题解决
- QQ商家(QQ在线咨询,QQ推广等)
- Js(二)SyntaxError Cannot use import statement outside a module
- 弘辽科技:拼多多没出单改销量吗?拼多多如何提高销量?
- bedtools 批量提取snp前后1000bp片段
- 基于CNN 对车牌数字进行识别,(二)
- CSU 1596: Dick.Z 的炉石赛(模拟)
- 微信小程序联盟:官方文档+精品教程+demo集合(未完待续,持续更新中……)
热门文章
- SpringCloud之服务提供者和服务消费者
- 一年级上册计算机教学计划,一年级信息技术上册教学计划
- 一元享移动怎么样_移动新套餐:18元享“全免流”+1元1G流量,阿里鱼卡要遭殃?...
- Oracle启动监听错误TNS-12555: TNS:permission denied
- Miracast协议
- 帝国php改密码后登录不进去,帝国CMS安装,后台,登陆,密码常见问题汇总
- Hunger Snake 2
- 2022年第七届IEEE云计算与大数据分析国际会议
- 火狐Android 附加组件,Android版Firefox 85允许AMO安装附加组件
- 计算机网络运行管理,计算机网络管理规定