【时间序列预测/分类】 全系列60篇由浅入深的博文汇总:传送门


上篇文章介绍了人类活动识别常用的方法、最新进展和面临的挑战。UCI人类活动识别数据集是人类活动识别领域的benchmark数据集(还有一个常用的特征维数和活动种类更多的OPPORTUNITY数据集,会在之后的文章中介绍),本文详细介绍了UCI-HAR数据集,并通过该数据集来探索加载数据集方法、数据可视化流程、问题建模分析以及模型评估思路,为以后的建模实现分类任务打好基础。


文章目录

  • 前言
  • 1. UCI-HAR 数据集介绍
    • 1.1 简介
    • 1.2 数据收集、处理流程
    • 1.3 难点解惑
    • 1.4 训练集和测试集文件下的文件介绍
  • 2. 加载数据
    • 2.1 加载单个文件
    • 2.2 加载所有文件
  • 3. 活动类别平衡性分析
  • 4. 绘制各特征数据折线图
    • 4.1 获取训练集/测试集中的志愿者编号
    • 4.2 截取指定志愿者所属的数据样本
    • 4.3 数据样本去重叠
    • 4.4 绘制指定志愿者的训练样本/测试样本折线图
  • 5. 查看每位志愿者的数据分布情况(直方图)
    • 5.1 加速度直方图
    • 5.2 角速度分布直方图
    • 5.3 总的重力加速度直方图
  • 6. 每一类(共6类)的分布情况
  • 7. 活动持续时间的分布
  • 8. 建模分析
    • 8.1 问题框架
    • 8.2 数据准备
    • 8.3 预测建模
  • 9. 模型评估
  • 10. 扩展

前言

人类活动识别是将专用硬件设备或智能手机记录的加速度计数据序列分类为已知的明确运动的问题。考虑到每秒产生的大量观测数据、观测数据的时间性质以及缺乏将加速度计数据与已知运动联系起来的明确方法,这是一个具有挑战性的问题。经典的方法包括基于固定大小窗口的时间序列数据和训练机器学习模型(如决策树集合)的人工提取特征的方法。困难在于,特征工程需要有信号处理、数理统计、机器学习等领域的专业知识。近年来,诸如递归神经网络(RNN)和一维卷积神经网络(CNN)等深度学习方法被证明能够在很少或没有数据特征工程的情况下,为具有挑战性的活动识别任务提供最好的表现。本文主要内容如下:

  • UCI-HAR 数据集详细介绍。
  • 如何加载数据集和处理数据。
  • 如何使用折线图、直方图和方框图来更好地理解数据。
  • 如何对问题建模,包括框架、数据准备、建模和评估。

1. UCI-HAR 数据集介绍

1.1 简介

UCI 人类活动识别数据集是以智能手机采集的传感器数据为基础的活动识别,创建于2012年,实验团队来自意大利热那亚大学。在2012年的论文《Human Activity Recognition on Smartphones using a Multiclass Hardware-Friendly Support Vector Machine》中,采用机器学习算法建模,提供了该数据集分类性能的baseline。在2013年的论文《A Public Domain Dataset for Human Activity Recognition Using Smartphones》中,对数据集进行了全面描述。数据集可以从UCI机器学习存储库免费下载:

时间序列分类02:数据可视化与问题分析建模流程详解(UCI-HAR)相关推荐

  1. python动态图表变化_Python数据可视化 pyecharts实现各种统计图表过程详解

    Python数据可视化 pyecharts实现各种统计图表过程详解 发布时间:2020-09-10 04:53:26 来源:脚本之家 阅读:78 1.pyecharts介绍 Echarts是一款由百度 ...

  2. python做动态折线图_Python数据可视化 pyecharts实现各种统计图表过程详解

    1.pyecharts介绍 Echarts是一款由百度公司开发的开源数据可视化JS库,pyecharts是一款使用python调用echarts生成数据可视化的类库,可实现柱状图,折线图,饼状图,地图 ...

  3. python数据可视化的特点_Python数据可视化 pyecharts实现各种统计图表过程详解

    1.pyecharts介绍 Echarts是一款由百度公司开发的开源数据可视化JS库,pyecharts是一款使用python调用echarts生成数据可视化的类库,可实现柱状图,折线图,饼状图,地图 ...

  4. python数据可视化-matplotlib之散点图sactter函数详解

    本文转载自-[数字的可视化:python画图之散点图sactter函数详解] 感谢博主-hefei_cyp的博客 最近开始学习Python编程,遇到scatter函数,感觉里面的参数不知道什么意思于是 ...

  5. python金融大数据挖掘与分析全流程详解_(特价书)Python金融大数据挖掘与分析全流程详解...

    前言 如何获取学习资源 第1章 Python基础 1.1 Python安装与第一个Python程序12 1.1.1 安装Python12 1.1.2 编写第一个Python程序13 1.1.3 PyC ...

  6. RPA机器人数据抓取典型案例全流程详解

    数据抓取是实现流程自动化最关键的技能之一,尤其是Web数据抓取,但面对每个具体的业务场景和网站,如何稳定.高效地实现数据抓取? 在实战中进行数据抓取时,需要注意哪些问题? 这篇文章我们就来通过一个企查 ...

  7. NLP --- 文本分类(基于LDA的隐语意分析训练算法详解)

    上一节详细介绍了什么是LDA,详细讲解了他的原理,大家应该好好理解,如果不理解,这一节就别看了,你是看不懂的,这里我在简单的叙述LDA的算法思想: 首先我们只拥有很多篇文本和一个词典,那么我们就可以在 ...

  8. python中plot的plt.text_用Python进行数据可视化的第一步,全面详解matplotlib中样式属性...

    上篇内容我们详细了解了Python使用matplotlib绘制一个复杂的正弦函数的方法(参见),上篇内容我们提到了一个属性'b-',简单介绍了它是用来设置线条颜色和样式的属性.今天,我们详细了解一下P ...

  9. 《Python金融大数据挖掘与分析全流程详解》实战 笔记整理

    1.获取新浪财经实时股票数据 # ============================================================================= # 9.1 ...

最新文章

  1. SRCNN-图像超分辨的学习
  2. 无法从“const char [10]”转换为“char *”
  3. const深度总结(effective C++)
  4. 历经32载,域名仍是少年,更何况不足2岁的.xin?
  5. dedecms后台崩溃或者后台访问慢的解决方法
  6. SolarWinds 攻击者开发的新后门 FoggyWeb
  7. Ubuntu21.04安装网易有道词典
  8. 德州达拉斯大学计算机录取要求,德克萨斯大学达拉斯分校申请条件(德克萨斯大...
  9. Locality Sensitive Hashing ( LSH,局部敏感哈希 ) 详解
  10. 雷锋网专访布丁CEO徐磊
  11. 中专计算机专业execl教案,计算机专项目化教案(EXCEL教案
  12. Spring Boot学习案例开源项目
  13. 阿里和CVTE秋招面试题
  14. 《高等数学A》课堂笔记——高分必过
  15. thinkpad x12018换固态_终极之后是否还有究极?ThinkPad X1 Carbon 2018评测
  16. 微习惯瘦身,一天一个俯卧撑就够了吗?
  17. 手绘VS码绘——动态篇(视觉错觉)
  18. 医学序列图像定位线绘制基本方法介绍
  19. 实战检测北大青鸟某地方学校网站
  20. 浅谈学生数学思维能力的培养

热门文章

  1. 在线函数绘制网站x2
  2. CF-B. Morning Jogging
  3. 【python教程入门学习】Python的内存管理机制
  4. 计算机工程师中级答辩内容,中级工程师论文答辩(注意事项及答辩准备)
  5. sourceforge镜像站
  6. docker tag详解
  7. 科达教育视频会议系统服务四川彭州教育系统
  8. 在google drive使用google.colab云服务
  9. Java实现客户信息管理软件
  10. 多平台跨平台操作轻量剪贴板粘贴板软件