最近无聊,想玩玩数据挖掘,就拿天池的天池新人实战赛之[离线赛]练练手。https://tianchi.aliyun.com/getStart/information.htm?spm=5176.100067.5678.2.2b282b2bAOqNmy&raceId=231522

其中在处理数据时,我需要以日期为索引,比如将前6天的数据作为训练集,第7天的数据作为预测集。下图是阿里给的数据。

由于我们需要按天来统计数据,所以暂时认为几点购买的这个信息没什么用,我想去掉。要怎么去掉呢?

我们可以看到,时间列是object类型,先对其进行转换。

然后这里有几种方法去除时间:

上图的第二句话是设置时间为索引。

第二种方法:

all_user['time'] = pd.to_datetime(all_user['time']).dt.date 

这种方法很慢,请不要轻易尝试。或者:
all_user['time'] = pd.to_datetime(all_user['time']).dt.floor('d') 

具体可以参考:https://stackoverflow.com/questions/16176996/keep-only-date-part-when-using-pandas-to-datetime。然后我们就可以分割数据为训练集和预测集了。
train_user = all_user['2014-11-22':'2014-11-27']
train_user_predict = all_user['2014-11-28']
valid_user = all_user['2014-11-29':'2014-12-04']
valid_user_predict = all_user['2014-12-05']
test_user = all_user['2014-12-13':'2014-12-18']
test_user_predict = all_user['2014-12-19']

转载于:https://www.cnblogs.com/subic/p/9000129.html

pandas如何去掉时间列的小时只保留日期相关推荐

  1. python中年月日只保留年月_气轻Python04.只保留日期去掉时间

    有时候需要从读取的Excel数据中查找指定日期的具体数据.而读取日期数据时会带有些不需要的时间等零碎,下面介绍去掉时间,只保留日期的方法. import datetime ############## ...

  2. oracle 截取时间至小时,如何在pandas中构造/取整到小时的本地化日期时间列

    我想把pandas python中本地化的datetime列截短/四舍五入到一小时.例如,如果我有2017-10-15 15:03:25+02:00,我希望获得2017-10-15 15 15:00: ...

  3. 只保留日期_时间序列:日期范围、频率与偏移量

    Pandas中的时间序列一般被认为是不规则的,也就是说,它们没有固定的频率.但是,它常常需要以某种相对固定的频率进行分析,比如每日.每月.每15分钟等(这样自然会在时间序列中引入缺失值).Pandas ...

  4. [ArcGIS] 表格输出为shp时日期时间列只保留日期而时间被截掉

    1.首先将存有GPS数据的表格加载到ArcGIS中, 2.然后右击表格-->Display XY Data,生成矢量数据. 查看dataall_csv&Events的属性表,可以看到此时 ...

  5. 把音频中的某个人声去掉_怎样去掉音频中的背景音乐 只保留人声?

    CE可以,软件图标如上.简单好用,方法如下.一.前提必须是标准的立体声音.分离起来非常方便,但一般都不是来.二.如果是单音轨的,也是可以去除的自,但是效果不是很好,始终能够听到一点人声百.1 打开Co ...

  6. 只保留日期_全历手表与年历腕表都能看日期,为何唯独万年历腕表价格不菲?...

    相信喜欢腕表的朋友都知道,不少正装手表都带有日历显示功能.但是带日历的腕表又分为全历.年历和万年历腕表,而其中只有万年历腕表才能称得上真正的复杂功能腕表.那么全历.年历和万年历腕表有什么区别呢?今天轻 ...

  7. Python pandas清除excel某列内容中字符串中间的空格

    import pandas as pd #读取EXCLE文件 df = pd.read_excel('C:\\Users\\Thinkpad\\Desktop\\应变计组2.xlsx') #去除文字内 ...

  8. oracle 查询重复数据并且删除, 只保留一条数据

    数据库操作中,经常会因为导数据造成数据重复,需要进行数据清理,去掉冗余的数据,只保留正确的数据 一:重复数据根据单个字段进行判断 1.首先,查询表中多余的数据,由关键字段(name)来查询. sele ...

  9. Linux使用shell命令显示系统时间,Linux操作系统的Shell命令:日期格式

    不管是哪种语言,日期/时间都是一个非常重要的值.比如我们保存日志的时候,往往是某个前缀再加上当前时间,这样日志文件名称就可以做到唯一. 在Shell环境里,我们获取时间的命令是date,但date出来 ...

  10. pandas使用max函数和min函数计算dataframe日期(时间)数据列中最大日期和最小日期对应的数据行(maximum and minimum date or time row)

    pandas使用max函数和min函数计算dataframe日期(时间)数据列中最大日期和最小日期对应的数据行(maximum and minimum date or time row in data ...

最新文章

  1. 软件工具将GPU代码迁移到fpga以用于AI应用
  2. 跟锦数学2017年04月
  3. hibernate一级缓存和二级缓存的区别[转]
  4. 元气森林唐彬森:十万块就能爆发团队创造力
  5. Boost:opencv卷积的测试程序
  6. cron4j的Jfinal plugin
  7. android 升级带服务端,安卓应用升级服务端设计思路
  8. 怎么运行verilog语言_(六) Verilog入门之有限状态机
  9. Spring Data JPA: 实现自定义Repository
  10. jsp springmvc 视图解析器_springMVC配置jsp/html视图解析器
  11. [深度学习TF2][RNN-NPL数据预处理] -Tokenizer函数
  12. ios 时间戳 当前时间 相互转化
  13. asset文件夹路径 unity_Unity Assets目录下的特殊文件夹名称
  14. Dinic算法(研究总结,网络流)
  15. centos7安装RabbitMQ详细过程
  16. 《见缝插针》游戏开发记录
  17. Rosetta Stone罗塞塔石碑学习语言Win+Mac最新v5.0.37完美破解版+全语言包
  18. Python学习笔记(4)-文件读取报错
  19. 计算机软件系统的三个层次,计算机软硬件系统
  20. PIE-Engine 教程:水稻面积提取1(宿迁市)

热门文章

  1. Linux之如何启动tomcat服务
  2. FR复选框批量删除(填报)
  3. mariadb 集群mysql_负载均衡的mariadb集群搭建
  4. row_number() over 相同日期不同序号_怡丽丝尔护肤品生产日期怎么看?怡丽丝尔护肤品保质期多久?...
  5. CS224N笔记——高级词向量表示
  6. thinkphp5---join联合查询
  7. 在项目中使用HTMLDom的事件冒泡机制
  8. 安装apk出现Parse error when parsing manifest. Discontinuing installation.解决方案
  9. Day1_HTML_表单标记
  10. 一个用python写的从数字高程格式文件(DEM)中提取水系的模块