pandas如何去掉时间列的小时只保留日期
最近无聊,想玩玩数据挖掘,就拿天池的天池新人实战赛之[离线赛]练练手。https://tianchi.aliyun.com/getStart/information.htm?spm=5176.100067.5678.2.2b282b2bAOqNmy&raceId=231522
其中在处理数据时,我需要以日期为索引,比如将前6天的数据作为训练集,第7天的数据作为预测集。下图是阿里给的数据。
由于我们需要按天来统计数据,所以暂时认为几点购买的这个信息没什么用,我想去掉。要怎么去掉呢?
我们可以看到,时间列是object类型,先对其进行转换。
然后这里有几种方法去除时间:
上图的第二句话是设置时间为索引。
第二种方法:
all_user['time'] = pd.to_datetime(all_user['time']).dt.date
这种方法很慢,请不要轻易尝试。或者:
all_user['time'] = pd.to_datetime(all_user['time']).dt.floor('d')
具体可以参考:https://stackoverflow.com/questions/16176996/keep-only-date-part-when-using-pandas-to-datetime。然后我们就可以分割数据为训练集和预测集了。
train_user = all_user['2014-11-22':'2014-11-27']
train_user_predict = all_user['2014-11-28']
valid_user = all_user['2014-11-29':'2014-12-04']
valid_user_predict = all_user['2014-12-05']
test_user = all_user['2014-12-13':'2014-12-18']
test_user_predict = all_user['2014-12-19']
转载于:https://www.cnblogs.com/subic/p/9000129.html
pandas如何去掉时间列的小时只保留日期相关推荐
- python中年月日只保留年月_气轻Python04.只保留日期去掉时间
有时候需要从读取的Excel数据中查找指定日期的具体数据.而读取日期数据时会带有些不需要的时间等零碎,下面介绍去掉时间,只保留日期的方法. import datetime ############## ...
- oracle 截取时间至小时,如何在pandas中构造/取整到小时的本地化日期时间列
我想把pandas python中本地化的datetime列截短/四舍五入到一小时.例如,如果我有2017-10-15 15:03:25+02:00,我希望获得2017-10-15 15 15:00: ...
- 只保留日期_时间序列:日期范围、频率与偏移量
Pandas中的时间序列一般被认为是不规则的,也就是说,它们没有固定的频率.但是,它常常需要以某种相对固定的频率进行分析,比如每日.每月.每15分钟等(这样自然会在时间序列中引入缺失值).Pandas ...
- [ArcGIS] 表格输出为shp时日期时间列只保留日期而时间被截掉
1.首先将存有GPS数据的表格加载到ArcGIS中, 2.然后右击表格-->Display XY Data,生成矢量数据. 查看dataall_csv&Events的属性表,可以看到此时 ...
- 把音频中的某个人声去掉_怎样去掉音频中的背景音乐 只保留人声?
CE可以,软件图标如上.简单好用,方法如下.一.前提必须是标准的立体声音.分离起来非常方便,但一般都不是来.二.如果是单音轨的,也是可以去除的自,但是效果不是很好,始终能够听到一点人声百.1 打开Co ...
- 只保留日期_全历手表与年历腕表都能看日期,为何唯独万年历腕表价格不菲?...
相信喜欢腕表的朋友都知道,不少正装手表都带有日历显示功能.但是带日历的腕表又分为全历.年历和万年历腕表,而其中只有万年历腕表才能称得上真正的复杂功能腕表.那么全历.年历和万年历腕表有什么区别呢?今天轻 ...
- Python pandas清除excel某列内容中字符串中间的空格
import pandas as pd #读取EXCLE文件 df = pd.read_excel('C:\\Users\\Thinkpad\\Desktop\\应变计组2.xlsx') #去除文字内 ...
- oracle 查询重复数据并且删除, 只保留一条数据
数据库操作中,经常会因为导数据造成数据重复,需要进行数据清理,去掉冗余的数据,只保留正确的数据 一:重复数据根据单个字段进行判断 1.首先,查询表中多余的数据,由关键字段(name)来查询. sele ...
- Linux使用shell命令显示系统时间,Linux操作系统的Shell命令:日期格式
不管是哪种语言,日期/时间都是一个非常重要的值.比如我们保存日志的时候,往往是某个前缀再加上当前时间,这样日志文件名称就可以做到唯一. 在Shell环境里,我们获取时间的命令是date,但date出来 ...
- pandas使用max函数和min函数计算dataframe日期(时间)数据列中最大日期和最小日期对应的数据行(maximum and minimum date or time row)
pandas使用max函数和min函数计算dataframe日期(时间)数据列中最大日期和最小日期对应的数据行(maximum and minimum date or time row in data ...
最新文章
- 软件工具将GPU代码迁移到fpga以用于AI应用
- 跟锦数学2017年04月
- hibernate一级缓存和二级缓存的区别[转]
- 元气森林唐彬森:十万块就能爆发团队创造力
- Boost:opencv卷积的测试程序
- cron4j的Jfinal plugin
- android 升级带服务端,安卓应用升级服务端设计思路
- 怎么运行verilog语言_(六) Verilog入门之有限状态机
- Spring Data JPA: 实现自定义Repository
- jsp springmvc 视图解析器_springMVC配置jsp/html视图解析器
- [深度学习TF2][RNN-NPL数据预处理] -Tokenizer函数
- ios 时间戳 当前时间 相互转化
- asset文件夹路径 unity_Unity Assets目录下的特殊文件夹名称
- Dinic算法(研究总结,网络流)
- centos7安装RabbitMQ详细过程
- 《见缝插针》游戏开发记录
- Rosetta Stone罗塞塔石碑学习语言Win+Mac最新v5.0.37完美破解版+全语言包
- Python学习笔记(4)-文件读取报错
- 计算机软件系统的三个层次,计算机软硬件系统
- PIE-Engine 教程:水稻面积提取1(宿迁市)
热门文章
- Linux之如何启动tomcat服务
- FR复选框批量删除(填报)
- mariadb 集群mysql_负载均衡的mariadb集群搭建
- row_number() over 相同日期不同序号_怡丽丝尔护肤品生产日期怎么看?怡丽丝尔护肤品保质期多久?...
- CS224N笔记——高级词向量表示
- thinkphp5---join联合查询
- 在项目中使用HTMLDom的事件冒泡机制
- 安装apk出现Parse error when parsing manifest. Discontinuing installation.解决方案
- Day1_HTML_表单标记
- 一个用python写的从数字高程格式文件(DEM)中提取水系的模块