龙珠训练营机器学习算法(一)学习笔记
本学习笔记为阿里云天池龙珠计划机器学习训练营的学习内容,学习链接为:点我跳转
感谢各位的阅读
- 为什么突然学阿里
- 学习知识点概要
- 学习内容
- 1 逻辑回归的介绍和应用
- 1.1逻辑回归的介绍
- 1.2 逻辑回归的应用
- 2.基于鸢尾花(iris)数据集的逻辑回归分类实践
- 鸢尾花有关的分析
- 流程(最终实现代码不唯一)
- Step1:库函数导入
- Step2:数据读取/载入
- Step3:可视化描述
- Step4:利用逻辑回归模型在二分类上进行训练和预测
为什么突然学阿里
我个人感觉,任何事物都有两面性,就和硬币一样。每个机器学习的网站都有不足以及自己的长处,我们不断学习各家之所长,提升自己的编程能力何尝不是一种享受。
学习知识点概要
逻辑回归的介绍和应用、代码流程、鸢尾花实列
学习内容
1 逻辑回归的介绍和应用
1.1逻辑回归的介绍
逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型
逻辑回归模型的优劣势:
优点: 实现简单,易于理解和实现;计算代价不高,速度很快,存储资源低;
缺点: 容易欠拟合,分类精度可能不高
1.2 逻辑回归的应用
逻辑回归模型广泛用于各个领域,包括机器学习,大多数医学领域和社会科学。例如,最初由Boyd 等人开发的创伤和损伤严重度评分(TRISS)被广泛用于预测受伤患者的死亡率,使用逻辑回归 基于观察到的患者特征(年龄,性别,体重指数,各种血液检查的结果等)分析预测发生特定疾病(例如糖尿病,冠心病)的风险。逻辑回归模型也用于预测在给定的过程中,系统或产品的故障的可能性。还用于市场营销应用程序,例如预测客户购买产品或中止订购的倾向等。在经济学中它可以用来预测一个人选择进入劳动力市场的可能性,而商业应用则可以用来预测房主拖欠抵押贷款的可能性。条件随机字段是逻辑回归到顺序数据的扩展,用于自然语言处理。
2.基于鸢尾花(iris)数据集的逻辑回归分类实践
鸢尾花有关的分析
本次我们选择鸢花数据(iris)进行方法的尝试训练,该数据集一共包含5个变量,其中4个特征变量,1个目标分类变量。共有150个样本,目标变量为 花的类别 其都属于鸢尾属下的三个亚属,分别是山鸢尾 (Iris-setosa),变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。包含的三种鸢尾花的四个特征,分别是花萼长度(cm)、花萼宽度(cm)、花瓣长度(cm)、花瓣宽度(cm),这些形态特征在过去被用来识别物种。
流程(最终实现代码不唯一)
Step1:库函数导入
## 基础函数库
import numpy as np
import pandas as pd## 绘图函数库
import matplotlib.pyplot as plt
import seaborn as sns
注意:这里,我就好奇,即然是库导入,为什么不一步到位,逻辑回归在sklearn里面吖。
Step2:数据读取/载入
我们利用 sklearn 中自带的 iris 数据作为数据载入,并利用Pandas转化为DataFrame格式
from sklearn.datasets import load_iris
data = load_iris() #得到数据特征
iris_target = data.target #得到数据对应的标签
iris_features = pd.DataFrame(data=data.data, columns=data.feature_names) #利用Pandas转化为DataFrame格式
Step3:可视化描述
## 合并标签和特征信息
iris_all = iris_features.copy() ##进行浅拷贝,防止对于原始数据的修改
iris_all['target'] = iris_target
## 特征与标签组合的散点可视化
sns.pairplot(data=iris_all,diag_kind='hist', hue= 'target')
plt.show()
Step4:利用逻辑回归模型在二分类上进行训练和预测
这个我写过多次了,不进行赘述了。
龙珠训练营机器学习算法(一)学习笔记相关推荐
- 天池龙珠计划机器学习训练营机器学习基础知识学习笔记--Task03
天池龙珠计划机器学习训练营–Task03重点记录 LightGBM的介绍 LightGBM的主要优点: 简单易用.提供了主流的Python\C++\R语言接口,用户可以轻松使用LightGBM建模并获 ...
- 天池龙珠训练营-机器学习学习笔记-03 LightGBM 分类
天池龙珠训练营-机器学习学习笔记-03 LightGBM 分类 本学习笔记为阿里云天池龙珠计划机器学习训练营的学习内容,学习链接为:训练营 一 原理简介: 它是一款基于GBDT(梯度提升决策树)算法的 ...
- 龙珠训练营机器学习笔记task03
龙珠训练营机器学习笔记task03 本学习笔记为阿里云天池龙珠计划机器学习训练营的学习内容,学习链接为:https://tianchi.aliyun.com/notebook-ai/detail?sp ...
- 龙珠训练营机器学习笔记
龙珠训练营机器学习笔记 本学习笔记为阿里云天池龙珠计划机器学习训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/promotion/aicampml ...
- 《基于张量网络的机器学习入门》学习笔记8(Shor算法)
<基于张量网络的机器学习入门>学习笔记8 Shor算法 来源 Shor算法的大致流程 因数分解 周期求取与量子傅里叶变换(QFT) Shor算法 来源 1994 1994 1994年,应用 ...
- 《机器学习实战》学习笔记(七):利用AdaBoost 元算法提高分类性能
欢迎关注WX公众号:[程序员管小亮] [机器学习]<机器学习实战>读书笔记及代码 总目录 https://blog.csdn.net/TeFuirnever/article/details ...
- 『ML』利用K-Means聚类算法对未标注数据分组——《机器学习实战》学习笔记(Ch10)
本节用Python实现K-Means算法,对未标注的数据进行聚类. 在做完聚类后,如何对于聚类结果进行评估?请看 用Python实现聚类效果的评估(轮廓系数.互信息) 导航 K-Means简介 代码实 ...
- 《基于张量网络的机器学习入门》学习笔记7
<基于张量网络的机器学习入门>学习笔记7 量子算法 什么是量子算法 三个经典量子算法 Grover算法 背景 基本原理 例题 量子算法 什么是量子算法 例如我们求解一个问题,一个111千克 ...
- 台湾大学林轩田机器学习技法课程学习笔记4 -- Soft-Margin Support Vector Machine
红色石头的个人网站:redstonewill.com 上节课我们主要介绍了Kernel SVM.先将特征转换和计算内积这两个步骤合并起来,简化计算.提高计算速度,再用Dual SVM的求解方法来解决. ...
最新文章
- 树莓派电压过低 串口数据错误增多
- spell_picture第三版终于摆脱了命令行的操作
- 人类血液中首次发现微塑料颗粒,饮料瓶塑料袋化妆品都是来源
- placeholder调整颜色
- android的NDK和java进行本地socket通信
- dubbo调用失败策略_面试官:dubbo负载均衡策略,集群容错策略,动态代理策略有哪些...
- linux netfilter 过滤数据包,Netfilter-iptabes报文过滤框架(一)
- linux chmod修改权限失败,Linux chmod修改文件夹权限
- TokenInsight:反映区块链行业整体表现的TI指数较昨日同期上涨2.66%
- (CPSCA's)CPOJC+VIJOS
- Kubernetes 小白学习笔记(10)--搭建一个kubernetes集群-组建节点网络
- Opencv椭圆拟合
- JavaScript利用Date对象实现倒计时效果
- Binder之AIDL进程间通信的使用(附源码)
- linux下fstat、stat和lstat 区别(转)
- hive安装:3.1.2版本
- 使用编码器控制步进电机
- 汉字点阵字库的原理与显示
- 安装Kibana、head、IK分词器后IK的使用
- 数据库用户登录验证及注册功能实现