您可以在dt.date之前使用groupby并在last之前聚合:

#if necessery convert to datetime

df.time_dt = pd.to_datetime(df.time_dt)

df = df.groupby(df.time_dt.dt.date).last().reset_index(drop=True)

print (df)

time price_BRL qt time_dt

0 1312049148 23.40 1.00 2011-07-30 18:05:48

1 1312121523 23.50 6.50 2011-07-31 14:12:03

2 1312206416 23.25 1.00 2011-08-01 13:46:56

3 1312637929 18.95 4.00 2011-08-06 13:38:49

4 1312847064 16.00 0.86 2011-08-08 23:44:24

5 1312915666 6.00 0.01 2011-08-09 18:47:46

6 1312934897 19.90 1.00 2011-08-10 00:08:17

谢谢MaxU的另一个解决方案 – 为返回DataFrame添加参数as_index = False:

df = df.groupby(df.time_dt.dt.date,as_index=False).last()

print (df)

time price_BRL qt time_dt

0 1312049148 23.40 1.00 2011-07-30 18:05:48

1 1312121523 23.50 6.50 2011-07-31 14:12:03

2 1312206416 23.25 1.00 2011-08-01 13:46:56

3 1312637929 18.95 4.00 2011-08-06 13:38:49

4 1312847064 16.00 0.86 2011-08-08 23:44:24

5 1312915666 6.00 0.01 2011-08-09 18:47:46

6 1312934897 19.90 1.00 2011-08-10 00:08:17

使用resample的解决方案,但必须在dropna之前删除NaN行:

df = df.resample('d',on='time_dt').last().dropna(how='all').reset_index(drop=True)

#cast column time to int

df.time = df.time.astype(int)

print (df)

time price_BRL qt time_dt

0 1312049148 23.40 1.00 2011-07-30 18:05:48

1 1312121523 23.50 6.50 2011-07-31 14:12:03

2 1312206416 23.25 1.00 2011-08-01 13:46:56

3 1312637929 18.95 4.00 2011-08-06 13:38:49

4 1312847064 16.00 0.86 2011-08-08 23:44:24

5 1312915666 6.00 0.01 2011-08-09 18:47:46

6 1312934897 19.90 1.00 2011-08-10 00:08:17

df = df.groupby(df.time_dt.dt.month).last().reset_index(drop=True)

print (df)

time price_BRL qt time_dt

0 1312121523 23.5 6.5 2011-07-31 14:12:03

1 1312934897 19.9 1.0 2011-08-10 00:08:17

有几个小时它有点复杂,如果需要groupby按日期和小时一起,解决方案是用astype将分钟和秒数替换为0:

hours = df.time_dt.values.astype('

python按时间分类数据_Pandas / Python – 按时间段分组数据相关推荐

  1. python与算法社区_【Python算法】分类与预测——Python随机森林

    [Python算法]分类与预测--Python随机森林 1.随机森林定义 随机森林是一种多功能的机器学习算法,能够执行回归和分类的任务.同时,它也是一种数据降维手段,在处理缺失值.异常值以及其他数据探 ...

  2. Python Seaborn (5) 分类数据的绘制

    作者:未禾 数据猿官网 | www.datayuan.cn 今日头条丨一点资讯丨腾讯丨搜狐丨网易丨凤凰丨阿里UC大鱼丨新浪微博丨新浪看点丨百度百家丨博客中国丨趣头条丨腾讯云·云+社区 我们之前探讨了如 ...

  3. python与excel做数据可视化-python做可视化数据分析,究竟怎么样?

    Python做可视化数据分析也是可以的,只是对比起来专业的可视化工具有些得不应手,做出来的图可能不太美观.Python用来处理数据,用来分析绝对可以.我觉得想要可视化可以使用专门的可视化工具. 不过, ...

  4. python批量修改excel数据_/python批量修改excel工作薄

    你好,怎么用Python对一个文件夹里包含多个Excel子文件进行批量修改某一单元格(是合并的)? 工作中经常用到Excel多事情都重复处理,比如每日报,每周的周报,各种数据表,这种固定的表其实都是6 ...

  5. python与excel做数据可视化-Python的Excel操作及数据可视化

    Excel表操作 python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库. 安装xlrd pip install xlrd 简单的表格读取 ...

  6. python调用通达信数据_[python]沪深龙虎榜数据导入通达信的自选板块并标注于k线图上...

    [python] 沪深龙虎榜数据导入通达信的自选板块, 并标注于 K 线图上 1 #coding=utf-8 2 3 # 读取 '[paint]' 开头的 csv 文件 4 #copyright @ ...

  7. python按照日期筛选数据_Pandas日期数据处理:如何按日期筛选、显示及统计数据...

    前言 pandas有着强大的日期数据处理功能,本期我们来了解下pandas处理日期数据的一些基本功能,主要包括以下三个方面: 按日期筛选数据 按日期显示数据 按日期统计数据 运行环境为 windows ...

  8. python根据时间提取数据

    时间抽取:时间抽取,是根据一定的条件,对时间格式的数据进行抽取 1 根据索引进行抽取 DataFrame.ix[start:end]     DataFrame.ix[dates]   2 根据时间列 ...

  9. python按照日期筛选数据_pandas 按日期范围筛选数据的实现

    pandas 是 python 中一个功能强大的库,这里就不再复述了,简单介绍下用日期范围筛选 pandas 数据. 日期转换 用来筛选的列是 date 类型,所以这里要把要筛选的日期范围从字符串转成 ...

最新文章

  1. Java项目:酒店管理系统(java+SSM+jsp+mysql+maven)
  2. cpu线程_记w3wp占用CPU过高解决过程Dictionary线程安全
  3. php首页下雪源码代码,HTML5实现下雪效果的实例代码分享
  4. mysql添加字符串日期时间_mysql学习笔记--- 字符串函数、日期时间函数
  5. 《scikit-learn》数据预处理与特征工程(三)特征选择
  6. 微课|中学生可以这样学Python(5.5.3节):字符串格式化2
  7. BGP-13 配置BGP多路径发布
  8. php编译安装swoole模块
  9. 简单几步配置gitlab
  10. SQL variable type
  11. (附源码)计算机毕业设计SSM基于java语言的在线电子书阅读系统
  12. python连接阿里云服务器_阿里云服务器python
  13. 数据库期末知识点汇总
  14. List集合对象去重及按属性去重的8种方法
  15. Android修改APP名称和图标
  16. AWS携手光环云助力2019第三届“中信建投证券杯”世界智能围棋公开赛
  17. 浅析帧、帧数、帧率、FPS区别
  18. C++基础笔记——汇总版(上)
  19. 双显示器无法加载第二个
  20. 如何将PPT压缩后保存

热门文章

  1. 来吧,自己动手撸一个分布式ID生成器组件
  2. 一个项目三个坑,我懵了
  3. spring中定时器的使用
  4. StringEscapeUtils的资料
  5. Fields of Mathematics
  6. 动态规划之神奇的口袋问题
  7. 【转】ListT和ILIstT的区别
  8. docker entrypoint入口文件详解
  9. ubuntu下用vagrant搭建集群环境
  10. 每日一题20180401-Linux