UCI 人类活动识别数据集是以智能手机采集的传感器数据为基础的活动识别,创建于2012年,实验团队来自意大利热那亚大学。在2012年的论文《Human Activity Recognition on Smartphones using a Multiclass Hardware-Friendly Support Vector Machine》中,采用机器学习算法建模,提供了该数据集分类性能的baseline。在2013年的论文《A Public Domain Dataset for Human Activity Recognition Using Smartphones》中,对数据集进行了全面描述。

这些数据是从30名年龄在19岁到48岁之间的志愿者身上收集的,这些志愿者将智能手机绑在腰间,进行6项标准活动中的一项,通过开发的手机软件记录运动数据。同时记录每个执行活动的志愿者的视频,后期根据这些视频和传感器数据进行手动标记所属运动类别(类似剪辑视频中的音画同步)。执行的六项活动如下:
Walking;Walking Upstairs;Walking Downstairs;Sitting;Standing;Laying;

选择30名年龄在19-48岁之间的志愿者作为研究对象。记录的运动数据是来自智能手机(特别是三星Galaxy S II)的x、y和z加速度计数据(线性加速度)和陀螺仪数据(角速度),采样频率为 50Hz(每秒50个数据点)。每名志愿者进行两次活动序列,第一次在设备位于腰间左侧,第二次测试时,智能手机由用户自己按喜好放置。

原始数据不可用。数据集,提供了数据集的预处理版本。预处理步骤包括:

使用噪声滤波器对加速度计和陀螺仪进行预处理。
将数据分割成2.56秒(128个数据点)的固定窗口,重叠50%。
将加速度计数据分为重力(总)和人体运动分量。
我们使用手机加速度计和陀螺仪以50Hz 的采样率收集了三轴线性加速度和角速度信号。使用中值滤波器和截止频率为 20Hz的三阶低通Butter-worth滤波器对这些信号进行了预处理,以降低噪声。 该速率足以捕获人体运动,因为其能量的99%包含在15Hz以下[3]。 使用另一个巴特沃斯低通滤波器将具有重力和人体运动成分的加速度信号分离为人体加速度和重力。 假定重力仅具有低频分量,因此从实验中我们发现,对于恒定重力信号,0.3Hz是最佳转折频率。

将特征工程应用于窗口数据,并提供具有这些经过特征工程的数据。从每个窗口中提取了人类活动识别领域中常用的一些时间和频率特征。结果是一个561元素的特征向量。数据集根据受试者的数据分为训练集(70%)和测试集(30%),例如,训练21名受试者,测试9名受试者。

论文提出一个问题的框架,通过有分类标签的数据样本进行建模训练,以预测预测新对象上的运动活动。乍一看比较难理解的几个数据:

561 :特征工程之后的特征数,关于这些特征的说明,在数据集中的 features.txt和features_info.txt 作了详细说明,因为我们都是使用处理好的九轴传感器数据来建立深度学习模型,此处不再赘述。
128:数据集shape的第二个维度 128,看论文就很清楚了,在 2.56 秒的固定宽度滑动窗口中对时间信号进行采样,有 50% 的重叠。(2.56sec×50Hz = 128cycles)
7352 和 2947:数据集中将训练集和测试集中的传感器数据按照一个特征一个txt的格式各分成了9个文件,如下图所示。7352 和 2947 是测试集和训练集中每个txt文件shape的第一个维度,表示重采样之后的样本个数。一定要理解好数据集的shape!

训练集和测试集文件下的文件,文件格式相同、数量相同。我们以训练集文件夹下的文件为例说明:
一级目录:

test:测试集数据;
train:训练集数据;
activity_labels.txt:活动的真实标签(6个);
features.txt:特征工程的特征;
features_info.txt:特征工程处理说明;

X_train.txt:未经处理的原始数据,这个不用,可以不关心;
y_train.txt:活动类别标签(数字1-6表示),shape为(7352,1);说明:注意这里的标签是从1开始表示第一类,而one-hot编码是从0开始,注意编码的时候要减去1!这个在以后的建模过程中会遇到,先说明一下。
subject train.txt:将训练集的每一个样本与志愿者编号(1-30)对应,即给每条样本记录属于哪位志愿者做标识,shape为(7352,1);

body_acc_x_train.txt、body_acc_y_train.txt、body_acc_z_train.txt:三轴的加速度数据;
body_gyro_x_train.txt、body_gyro_y_train.txt、body_gyro_z_train.txt:三轴的陀螺仪数据(角速度);
total_acc_x_train.txt、total_acc_y_train.txt、total_acc_z_train.txt:三轴的重力加速度数据;
test 文件夹下的文件结构跟 train 文件夹下是相同的,只是shape不一样。本文和以后的几篇文章中,使用的都是这两个文件夹下的数据作为训练数据和测试数据,不使用原始数据和经过特征工程的数据。

更多精彩内容请关注:

人类活动识别---数据集UCI-HAR简介相关推荐

  1. 时间序列分类01:人类活动识别深度学习模型综述

    [时间序列预测/分类] 全系列60篇由浅入深的博文汇总:传送门 本文介绍了人类活动识别相关领域的建模方法和理论研究. 文章目录 前言 相关论文 1. 人类活动识别简介 2. 使用神经网络进行建模的优势 ...

  2. 人类活动识别的深度学习模型

    目录 概述 人类活动识别 神经网络建模的好处 监督学习数据表示 卷积神经网络模型 递归神经网络模型 人类活动识别(Human Activity Recognition)是一项具有挑战性的时间序列分类任 ...

  3. 人类动作识别数据集AVA

    原文地址:https://research.googleblog.com/2017/10/announcing-ava-finely-labeled-video.html 视频人类动作识别是计算机视觉 ...

  4. 谷歌发布人类动作识别数据集AVA,精确标注多人动作

    选自Google Research 机器之心编译 参与:路雪 视频人类动作识别是计算机视觉领域中的一个基础问题,但也具备较大的挑战性.现有的数据集不包含多人不同动作的复杂场景标注数据,今日谷歌发布了精 ...

  5. 【Python数据挖掘】用朴素贝叶斯预测人类活动识别

    朴素贝叶斯 朴素贝叶斯方法是一组基于应用贝叶斯定理的监督学习算法,其"朴素"假设是给定类变量值的每对特征之间的条件独立性.贝叶斯定理陈述了以下关系,给定类变量

  6. 『迷你教程』识别人类活动的一维卷积神经网络模型,附完整代码

    文章目录 使用智能手机数据集进行活动识别 开发一维卷积神经网络 拟合和评估模型 总结结果 调整一维卷积神经网络 过滤器数量 内核大小 多头卷积神经网络 一些拓展的想法 人类活动识别是将专用线束或智能手 ...

  7. 1D卷积网络HAR(人体活动识别)实践

    HAR(人体活动识别)是根据加速度计序列数据,将活动分类为已知的预定义的活动类别,其数据是由专业设备或智能手机记录的. 解决这个问题的传统方法需要手工制作特征,这些特征来自于基于固定大小的窗口和训练机 ...

  8. Dataset之Handwritten Digits:Handwritten Digits(手写数字图片识别)数据集简介、安装、使用方法之详细攻略

    Dataset之Handwritten Digits:Handwritten Digits(手写数字图片识别)数据集简介.安装.使用方法之详细攻略 目录 Handwritten Digits数据集的简 ...

  9. 四个动作识别数据集的简介

    1.UT-Interaction数据集 包含6类人与人交互的视频:挥手,指向,拥抱,推,踢和用拳猛击.总共有20个视频序列的长度约为1分钟.每个视频每个交互至少包含一次执行,为每个视频平均提供8次人类 ...

最新文章

  1. BP网络Python实现代码
  2. Struts2中的struts.multipart.saveDir的配置
  3. Eclipse小技巧
  4. DundasWebChart 5.5 破解续.
  5. 第五届“达观杯”自然语言处理文本分类竞赛开启报名,丰厚奖金等你来战!...
  6. Node.js 2021年开发者报告解读
  7. c#语言输出字符串长度,根据宽度来决定显示的字符串长度(C#)
  8. hive的SerDe序列化
  9. Vue 左右翻页,点赞动画
  10. Mysql学习总结(18)——Mysql主从架构的复制原理及配置详解
  11. python入门_老男孩_数据类型简介_int/bool/str转换_字符串索引和切片_字符串操作_day3...
  12. linux下查看当前shell方法。
  13. 解决Chrome浏览器无法加载flash插件的问题
  14. 艰难困苦,玉汝于成!
  15. android画布橡皮,Android 图片涂鸦橡皮擦功能
  16. 【Qt】边学边写之Qt教程(零基础)
  17. 红米note3全网通_标注:2015112_官方线刷包_救砖包_解账户锁
  18. linux从新建命令窗口快捷键,tmux 常用命令及快捷键
  19. 论文学习——洪水预报实时校正技术研究进展
  20. 跨越异构鸿沟,Redis 迁移同步过程中的挑战与解决方案

热门文章

  1. 运行在命令行的微信 cmd-wechat-terminal
  2. YOLO v5 实现目标检测(参考数据集自制数据集)
  3. Ipoe和Pppoe,宽带认证技术
  4. 国家基金申请书撰写的共性问题(转)
  5. Debug:ValueError: malformed node or string
  6. -2岁的产品经理学习日记2020/2/15
  7. MySQL数据库安全
  8. 建议收藏!仓库规划与布局设计整体方案
  9. 3、原币金额和本币金额
  10. 少儿C++编程从入门到进阶 信奥学奥赛从启蒙到NOI、ACM-ICPC(一)