Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK2

使用语言:python

Tas1 – Task5

Task2_数据探索性分析

涉及函数:总览+判断数据缺失和异常+分布

data.head().append(data.tail()) ——观察首尾数据
data.isnull().sum() ——查看每列的存在nan情况
data.shape ——观察数据集的行列信息
data.describe() ——获取数据的相关统计量
data.info() ——获取数据类型

describe种有每列的统计量,个数count、平均值mean、方差std、最小值min、中位数25% 50% 75% 、

#以及最大值 看这个信息主要是瞬间掌握数据的大概的范围以及每个值的异常值的判断,
#比如有的时候会发现999 9999 -1 等值这些其实都是nan的另外一种表达方式,有的时候需要注意下
  1. 总体分布概况(无界约翰逊分布等):三种分布
    plt.figure(1); plt.title(‘Default’)
    sns.distplot(y, rug=True, bins=20)
    plt.figure(2); plt.title(‘Normal’)
    sns.distplot(y, kde=False, fit=st.norm)
    plt.figure(3); plt.title(‘Log Normal’)
    sns.distplot(y, kde=False, fit=st.lognorm)

查看skewness and kurtosis
sns.distplot(Train_data[‘label’]);
print(“Skewness: %f” % Train_data[‘label’].skew())
print(“Kurtosis: %f” % Train_data[‘label’].kurt())

  1. 查看预测值的具体频数
    plt.hist(Train_data[‘label’], orientation = ‘vertical’,histtype = ‘bar’, color =‘red’)
    plt.show()


    友情链接:https://tianchi.aliyun.com/competition/
    Datawhale组织

Datawhale 零基础入门数据挖掘心跳信号分类学习反馈02相关推荐

  1. Datawhale 零基础入门数据挖掘心跳信号分类学习反馈

    Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK1 使用语言:python Tas1 – Task5 Task1 赛题理解: 根据给定的数据集,建立模型,预测不同的心跳信号(以预测 ...

  2. Datawhale 零基础入门数据挖掘心跳信号分类学习反馈03

    Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK3 使用语言:python Tas1 – Task5 Task3_数据特征工程分析 主要是针对时间序列的心电图数据加上:特征time ...

  3. Datawhale 零基础入门数据挖掘心跳信号分类学习反馈04

    Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK3 使用语言:python Tas1 – Task5 Task4 建模与调参 本次学习的重点是贪心调参.网格搜索调参.贝叶斯调参共三 ...

  4. 2021-03-17零基础入门数据挖掘-心跳信号分类预测

    零基础入门数据挖掘-心跳信号分类预测TASK02 1.学习目标: 2.学习内容 2.1载入库 2.2载入数据 2.3数据总览 2.4数据缺失和异常 2.5预测值分布 1.学习目标: 数据探索性分析ED ...

  5. Datawhale零基础入门数据挖掘-Task5模型融合

    Datawhale零基础入门数据挖掘-Task5模型融合 五.模型融合 5.1 模型融合目标 5.2 内容介绍 5.3 Stacking相关理论介绍 5.4 代码示例 5.4.1 回归\分类概率-融合 ...

  6. Task 3 特征工程 Datawhale零基础入门数据挖掘- 二手车交易价格预测

    Task 3 特征工程 Datawhale零基础入门数据挖掘- 二手车交易价格预测 Tips:此部分为零基础入门数据挖掘的Task3特征工程部分,主要包含各种特征工程以及分析方法 赛题:零基础入没人能 ...

  7. Datawhale 零基础入门数据挖掘-Task2 数据分析

    数据探索在机器学习中我们一般称为EDA(Exploratory Data Analysis):是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图.制表.方程拟合. ...

  8. 【组队学习】【23期】Datawhale零基础入门数据挖掘(心跳信号分类)

    零基础入门数据挖掘(心跳信号分类) 开源内容:https://github.com/datawhalechina/team-learning-data-mining/tree/master/Heart ...

  9. Datawhale 零基础入门数据挖掘-Task5 模型融合

    模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式. 一.简单加权融合 1.回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean): 2 ...

最新文章

  1. 工具用途_机械加工中研磨加工刀具(砂轮)﹑治工具及其用途
  2. Windows 8.1 PLSQL_32连接到RHEL6.1 Oracle10gr2_64
  3. 虚拟桌面几个常见问题?
  4. CodeForces - 1343D Constant Palindrome Sum(思维+差分数组)
  5. java 锁的类型_Java锁的种类 - shawnplaying的个人页面 - OSCHINA - 中文开源技术交流社区...
  6. 【CodeForces - 1051A】Vasya And Password (构造,水题)
  7. 三、bootstrap4 组件(警告和提示框、徽章和面包屑、按钮按钮组、卡片、列表组、导航和选项卡、分页和进度条、巨幕和旋转图标、轮播图、折叠菜单、下拉菜单、导航条、滚动监听、轻量弹框、模态框、表单)
  8. 论文推荐|【KSII TIIS 2021】DP-LinkNet:一种用于古籍文档图像二值化的卷积网络(有源码)...
  9. 用的最多的正则表达式
  10. 【Elasticsearch】 Full text queries query_string 等 字符串查询
  11. matlab2c使用c++实现matlab函数系列教程-wilkinson函数
  12. ftp和http转参数的使用(转)
  13. 数据抓包+hijson
  14. 语音播放与录音 (五分钟学会用 非常全面)
  15. 双基管理 运营_浅谈如何提升双基管理水平
  16. 北京理工大学计算机学硕考研科目,2021北京理工大学计算机考研科目
  17. docker配置国内加速器的两种方法
  18. 如何计算Java对象的大小
  19. 微型计算机 rtx2060,配i9+RTX2060!华硕灵耀X2 Pro展现魅力双屏
  20. Options API

热门文章

  1. Scanner 的知识与使用
  2. SELinux 关闭方法
  3. Kubernetes Cluster API(OpenStack)
  4. torch.range()和torch.arange()
  5. [RUST/腐蚀]Windows-开服服务端下载以及配置
  6. acm c++ 练习中出现的错误类型
  7. mysql之批量操作foreach用法
  8. 游戏 放逐之城 baishded之mod工具BanishedKit教程
  9. 生物解锁--指纹服务注册流程
  10. 使用Sakura Frp 将本地VNCServer端口映射到公网上