时间事件日志

个人时间统计工具。要点:

  • 使用 dida365.com 来作为 GTD 工具
  • 使用特殊格式记录事件类别和花费的时间,练习数据下载
  • 导出数据
  • 分析数据

读取数据

分析并读取数据

%matplotlib inline
import pandas as pd
import matplotlib.pyplot as pltfrom matplotlib.font_manager import FontManager
import subprocess    # 定义解析函数
def get_support_chinese_font():fm = FontManager()mat_fonts = set(f.name for f in fm.ttflist)output = subprocess.check_output('fc-list :lang=zh -f "%{family}\n"', shell=True)print '*' * 10, '系统可用的中文字体', '*' * 10print outputzh_fonts = set(f.split(',', 1)[0] for f in output.split('\n'))available = mat_fonts & zh_fontsprint '*' * 10, '可用的中文字体', '*' * 10for f in available:print freturn availablefrom matplotlib.pylab import mplmpl.rcParams['font.sans-serif'] = ['Arial Unicode MS'] # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题
# 定义时间解析函数
def _date_parser(dstr):return pd.Timestamp(dstr).date()data = pd.read_csv('data/dida365.csv', header=3, index_col='Due Date', parse_dates=True, date_parser=_date_parser)
data.head()
List Name Title Content Is Checklist Reminder Repeat Priority Status Completed Time Order Timezone Is All Day
Due Date
2016-05-24 自我成长 [编程] javascript exercism [1h] NaN N NaN NaN 0 2 2016-05-25T14:15:10+0000 -235295488344064 Asia/Shanghai True
2016-05-23 自我成长 [编程] javascript exercism [0.5h] NaN N NaN NaN 0 2 2016-05-24T15:59:08+0000 -234195976716288 Asia/Shanghai True
2016-05-23 自我成长 [编程] clojure ring request [2h] 阅读 ring.util.request 源码\r N NaN NaN 0 2 2016-05-24T15:58:56+0000 -233096465088512 Asia/Shanghai True
2016-05-22 自我成长 [编程] clojure ring 入门 [30m] NaN N NaN NaN 0 2 2016-05-23T15:03:24+0000 -231996953460736 Asia/Shanghai True
2016-05-22 自我成长 [探索发现] 体验 iMac 开发环境 [3h] iMac 的屏幕体验很棒,但使用非SSD硬盘速度上和mpb想着非常多。\r N NaN NaN 0 2 2016-05-23T14:33:35+0000 -230897441832960 Asia/Shanghai True

数据清洗

  • 只关心己完成或己达成的事件,即 status != 0 的事件
  • 只需要 List NameTitle 字段
df = data[data['Status'] != 0].loc[:, ['List Name', 'Title']]
df.head()
List Name Title
Due Date
2016-05-24 自我成长 [编程] javascript exercism [1h]
2016-05-23 自我成长 [编程] javascript exercism [0.5h]
2016-05-23 自我成长 [编程] clojure ring request [2h]
2016-05-22 自我成长 [编程] clojure ring 入门 [30m]
2016-05-22 自我成长 [探索发现] 体验 iMac 开发环境 [3h]

数据解析

解析事件类别和和花费的时间

import re# 定义标签解析函数
def parse_tag(value):m = re.match(r'^(\[(.*?)\])?.*$', value)if m and m.group(2):return m.group(2)else:return '其他'# 定义时间解析函数
def parse_duration(value):m = re.match(r'^.+?\[(.*?)([hm]?)\]$', value)if m:dur = 0try:dur = float(m.group(1))except e:print('parse duration error: \n%s' % e)if m.group(2) == 'm':dur = dur / 60.0return durelse:return 0titles = df['Title']
df['Tag'] = titles.map(parse_tag)
df['Duration'] = titles.map(parse_duration)
df.head()
List Name Title Tag Duration
Due Date
2016-05-24 自我成长 [编程] javascript exercism [1h] 编程 1.0
2016-05-23 自我成长 [编程] javascript exercism [0.5h] 编程 0.5
2016-05-23 自我成长 [编程] clojure ring request [2h] 编程 2.0
2016-05-22 自我成长 [编程] clojure ring 入门 [30m] 编程 0.5
2016-05-22 自我成长 [探索发现] 体验 iMac 开发环境 [3h] 探索发现 3.0
df.count()[Out:]
List Name    232
Title        232
Tag          232
Duration     232
dtype: int64
# 数据起始时间
start_date = df.index.min().date()
start_date[Out:]
datetime.date(2015, 12, 2)
# 截止时间
end_date = df.index.max().date()
end_date[Out:]
datetime.date(2016, 5, 24)

数据分析

时间总览

平均每天投资在自己身上的时间是多少?-> 全部时间 / 总天数

end_date - start_date[Out:]
datetime.timedelta(174)
df['Duration'].sum() [Out:]
482.19999999999999
df['Duration'].sum() / (end_date - start_date).days
2.7712643678160918

精力分配

tag_list = df.groupby(['Tag']).sum()
tag_list
Duration
Tag
写作 49.0
探索发现 54.5
机器学习 33.5
电影 50.8
编程 243.4
阅读 51.0
tag_list['Duration'].plot(kind='pie', figsize=(8, 8), fontsize=16, autopct='%1.2f%%')

专注力

长时间学习某项技能的能力

programming = df[df['Tag'] == '编程']
programming.head()
List Name Title Tag Duration
Due Date
2016-05-24 自我成长 [编程] javascript exercism [1h] 编程 1.0
2016-05-23 自我成长 [编程] javascript exercism [0.5h] 编程 0.5
2016-05-23 自我成长 [编程] clojure ring request [2h] 编程 2.0
2016-05-22 自我成长 [编程] clojure ring 入门 [30m] 编程 0.5
2016-05-22 自我成长 [编程] javascript exercism [0.5h] 编程 0.5
programming.resample('m', how='sum').to_period(freq='m').plot(kind='bar', figsize=(8, 8), fontsize=16)

连续时间的精力分配

以时间为横轴,查看精力分配。

# 为什么不直接使用 df.pivot()? 因为有重复的行索引,如 2016-05-23
date_tags = df.reset_index().groupby(['Due Date', 'Tag']).sum()
date_tags
Duration
Due Date Tag
2015-12-02 写作 3.0
2015-12-04 阅读 3.0
2015-12-06 写作 4.0
机器学习 3.0
2015-12-07 写作 1.0
2015-12-08 机器学习 1.0
编程 4.0
2015-12-09 写作 4.0
2015-12-10 探索发现 0.5
编程 5.5
2015-12-11 写作 1.5
编程 4.0
阅读 4.0
2015-12-12 写作 2.0
机器学习 1.5
2015-12-13 编程 6.0
2015-12-14 阅读 1.0
2015-12-15 机器学习 2.5
阅读 1.0
2015-12-16 探索发现 1.0
机器学习 1.5
编程 3.0
阅读 1.0
2015-12-17 机器学习 2.0
2015-12-18 写作 1.5
机器学习 1.0
编程 3.0
2015-12-19 探索发现 7.0
阅读 0.5
2015-12-20 写作 1.0
... ... ...
2016-04-24 编程 3.5
2016-04-25 编程 3.0
2016-04-26 编程 3.0
2016-04-29 编程 2.0
2016-04-30 编程 2.0
2016-05-01 编程 3.0
2016-05-02 编程 2.0
2016-05-03 编程 2.0
2016-05-04 编程 3.0
2016-05-05 编程 4.0
2016-05-06 编程 4.0
2016-05-07 编程 4.0
2016-05-08 编程 4.0
2016-05-09 编程 4.0
2016-05-10 编程 4.0
2016-05-11 编程 2.0
2016-05-12 编程 3.0
2016-05-13 探索发现 1.0
编程 3.0
2016-05-14 探索发现 1.0
编程 5.0
2016-05-15 编程 1.0
2016-05-17 编程 3.0
2016-05-18 编程 2.0
2016-05-19 编程 1.0
2016-05-20 编程 4.0
2016-05-22 探索发现 3.0
编程 1.0
2016-05-23 编程 2.5
2016-05-24 编程 1.0
# 以 tag 作为列索引
dates = date_tags.reset_index().pivot(index='Due Date', columns='Tag', values='Duration')
dates
Tag 写作 探索发现 机器学习 电影 编程 阅读
Due Date
2015-12-02 3.0 NaN NaN NaN NaN NaN
2015-12-04 NaN NaN NaN NaN NaN 3.0
2015-12-06 4.0 NaN 3.0 NaN NaN NaN
2015-12-07 1.0 NaN NaN NaN NaN NaN
2015-12-08 NaN NaN 1.0 NaN 4.0 NaN
2015-12-09 4.0 NaN NaN NaN NaN NaN
2015-12-10 NaN 0.5 NaN NaN 5.5 NaN
2015-12-11 1.5 NaN NaN NaN 4.0 4.0
2015-12-12 2.0 NaN 1.5 NaN NaN NaN
2015-12-13 NaN NaN NaN NaN 6.0 NaN
2015-12-14 NaN NaN NaN NaN NaN 1.0
2015-12-15 NaN NaN 2.5 NaN NaN 1.0
2015-12-16 NaN 1.0 1.5 NaN 3.0 1.0
2015-12-17 NaN NaN 2.0 NaN NaN NaN
2015-12-18 1.5 NaN 1.0 NaN 3.0 NaN
2015-12-19 NaN 7.0 NaN NaN NaN 0.5
2015-12-20 1.0 4.0 NaN NaN NaN NaN
2015-12-21 NaN NaN NaN NaN NaN 0.5
2015-12-22 NaN 2.0 NaN NaN 8.0 NaN
2015-12-23 NaN 1.0 NaN NaN NaN NaN
2015-12-24 NaN NaN NaN NaN NaN 0.5
2015-12-25 2.0 NaN NaN NaN NaN 1.5
2015-12-26 NaN NaN NaN NaN 2.0 1.0
2015-12-29 NaN NaN NaN NaN NaN 2.0
2015-12-30 NaN NaN NaN NaN NaN 1.0
2016-01-01 NaN NaN NaN NaN NaN 5.0
2016-01-02 NaN NaN NaN NaN 2.0 2.0
2016-01-03 NaN NaN NaN NaN 3.5 NaN
2016-01-04 NaN NaN NaN NaN 6.5 NaN
2016-01-05 2.0 2.0 NaN NaN NaN NaN
... ... ... ... ... ... ...
2016-04-21 NaN 2.0 NaN NaN 5.0 NaN
2016-04-22 NaN NaN NaN NaN 6.0 2.0
2016-04-23 NaN NaN NaN NaN 3.0 NaN
2016-04-24 NaN NaN NaN NaN 3.5 NaN
2016-04-25 NaN NaN NaN NaN 3.0 NaN
2016-04-26 NaN NaN NaN NaN 3.0 NaN
2016-04-29 NaN NaN NaN NaN 2.0 NaN
2016-04-30 NaN NaN NaN NaN 2.0 NaN
2016-05-01 NaN NaN NaN NaN 3.0 NaN
2016-05-02 NaN NaN NaN NaN 2.0 NaN
2016-05-03 NaN NaN NaN NaN 2.0 NaN
2016-05-04 NaN NaN NaN NaN 3.0 NaN
2016-05-05 NaN NaN NaN NaN 4.0 NaN
2016-05-06 NaN NaN NaN NaN 4.0 NaN
2016-05-07 NaN NaN NaN NaN 4.0 NaN
2016-05-08 NaN NaN NaN NaN 4.0 NaN
2016-05-09 NaN NaN NaN NaN 4.0 NaN
2016-05-10 NaN NaN NaN NaN 4.0 NaN
2016-05-11 NaN NaN NaN NaN 2.0 NaN
2016-05-12 NaN NaN NaN NaN 3.0 NaN
2016-05-13 NaN 1.0 NaN NaN 3.0 NaN
2016-05-14 NaN 1.0 NaN NaN 5.0 NaN
2016-05-15 NaN NaN NaN NaN 1.0 NaN
2016-05-17 NaN NaN NaN NaN 3.0 NaN
2016-05-18 NaN NaN NaN NaN 2.0 NaN
2016-05-19 NaN NaN NaN NaN 1.0 NaN
2016-05-20 NaN NaN NaN NaN 4.0 NaN
2016-05-22 NaN 3.0 NaN NaN 1.0 NaN
2016-05-23 NaN NaN NaN NaN 2.5 NaN
2016-05-24 NaN NaN NaN NaN 1.0 NaN
# 补足连续时间,可以看到哪些天没有在学习
full_dates = dates.reindex(pd.date_range(start_date, end_date)).fillna(0)
full_dates
Tag 写作 探索发现 机器学习 电影 编程 阅读
2015-12-02 3.0 0.0 0.0 0 0.0 0.0
2015-12-03 0.0 0.0 0.0 0 0.0 0.0
2015-12-04 0.0 0.0 0.0 0 0.0 3.0
2015-12-05 0.0 0.0 0.0 0 0.0 0.0
2015-12-06 4.0 0.0 3.0 0 0.0 0.0
2015-12-07 1.0 0.0 0.0 0 0.0 0.0
2015-12-08 0.0 0.0 1.0 0 4.0 0.0
2015-12-09 4.0 0.0 0.0 0 0.0 0.0
2015-12-10 0.0 0.5 0.0 0 5.5 0.0
2015-12-11 1.5 0.0 0.0 0 4.0 4.0
2015-12-12 2.0 0.0 1.5 0 0.0 0.0
2015-12-13 0.0 0.0 0.0 0 6.0 0.0
2015-12-14 0.0 0.0 0.0 0 0.0 1.0
2015-12-15 0.0 0.0 2.5 0 0.0 1.0
2015-12-16 0.0 1.0 1.5 0 3.0 1.0
2015-12-17 0.0 0.0 2.0 0 0.0 0.0
2015-12-18 1.5 0.0 1.0 0 3.0 0.0
2015-12-19 0.0 7.0 0.0 0 0.0 0.5
2015-12-20 1.0 4.0 0.0 0 0.0 0.0
2015-12-21 0.0 0.0 0.0 0 0.0 0.5
2015-12-22 0.0 2.0 0.0 0 8.0 0.0
2015-12-23 0.0 1.0 0.0 0 0.0 0.0
2015-12-24 0.0 0.0 0.0 0 0.0 0.5
2015-12-25 2.0 0.0 0.0 0 0.0 1.5
2015-12-26 0.0 0.0 0.0 0 2.0 1.0
2015-12-27 0.0 0.0 0.0 0 0.0 0.0
2015-12-28 0.0 0.0 0.0 0 0.0 0.0
2015-12-29 0.0 0.0 0.0 0 0.0 2.0
2015-12-30 0.0 0.0 0.0 0 0.0 1.0
2015-12-31 0.0 0.0 0.0 0 0.0 0.0
... ... ... ... ... ... ...
2016-04-25 0.0 0.0 0.0 0 3.0 0.0
2016-04-26 0.0 0.0 0.0 0 3.0 0.0
2016-04-27 0.0 0.0 0.0 0 0.0 0.0
2016-04-28 0.0 0.0 0.0 0 0.0 0.0
2016-04-29 0.0 0.0 0.0 0 2.0 0.0
2016-04-30 0.0 0.0 0.0 0 2.0 0.0
2016-05-01 0.0 0.0 0.0 0 3.0 0.0
2016-05-02 0.0 0.0 0.0 0 2.0 0.0
2016-05-03 0.0 0.0 0.0 0 2.0 0.0
2016-05-04 0.0 0.0 0.0 0 3.0 0.0
2016-05-05 0.0 0.0 0.0 0 4.0 0.0
2016-05-06 0.0 0.0 0.0 0 4.0 0.0
2016-05-07 0.0 0.0 0.0 0 4.0 0.0
2016-05-08 0.0 0.0 0.0 0 4.0 0.0
2016-05-09 0.0 0.0 0.0 0 4.0 0.0
2016-05-10 0.0 0.0 0.0 0 4.0 0.0
2016-05-11 0.0 0.0 0.0 0 2.0 0.0
2016-05-12 0.0 0.0 0.0 0 3.0 0.0
2016-05-13 0.0 1.0 0.0 0 3.0 0.0
2016-05-14 0.0 1.0 0.0 0 5.0 0.0
2016-05-15 0.0 0.0 0.0 0 1.0 0.0
2016-05-16 0.0 0.0 0.0 0 0.0 0.0
2016-05-17 0.0 0.0 0.0 0 3.0 0.0
2016-05-18 0.0 0.0 0.0 0 2.0 0.0
2016-05-19 0.0 0.0 0.0 0 1.0 0.0
2016-05-20 0.0 0.0 0.0 0 4.0 0.0
2016-05-21 0.0 0.0 0.0 0 0.0 0.0
2016-05-22 0.0 3.0 0.0 0 1.0 0.0
2016-05-23 0.0 0.0 0.0 0 2.5 0.0
2016-05-24 0.0 0.0 0.0 0 1.0 0.0
# 画出柱状图
full_dates.plot(kind='bar', stacked=True, figsize=(16, 8))

full_dates.resample('m', how='sum').to_period('m').plot(kind='bar', stacked=True, figsize=(8, 8))

实例:时间事件日志分析相关推荐

  1. Window事件日志分析

    Window事件日志简介 Windows系统日志是记录系统中硬件.软件和系统问题的信息,同时还可以监视系统中发生的事件.用 户可以通过它来检查错误发生的原因,或者寻找受到攻击时攻击者留下的痕迹. Wi ...

  2. Windows 事件日志分析管理

    Windows 设备是大多数商业网络中最受欢迎的选择.为了处理这些设备生成的数 TB 的事件日志数据,安全管理员需要使用功能强大的日志管理工具(如EventLog Analyzer),该工具可以通过自 ...

  3. python读取windows日志_Python取证技术(3): Windows 事件日志分析

    Windows的事件日志都存放在 C:WindowsSystem32winevtLogs 目录下.以evtx后缀结尾. 事件日志是在windows上记录重要事件发生的特殊文件,当用户登录系统或者程序报 ...

  4. Windows IIS 日志分析研究(Log Parser Log Parser Lizard Log Parser Studio) update...

    Windows主要有以下三类日志记录系统事件:应用程序日志.系统日志和安全日志. 存放目录:X:\Windows\System32\winevt\Logs\ System.evtx  系统日志 App ...

  5. Window如何进行日志分析

    0x01 Window事件日志简介 Windows系统日志是记录系统中硬件.软件和系统问题的信息,同时还可以监视系统中发生的事件.用户可以通过它来检查错误发生的原因,或者寻找受到攻击时攻击者留下的痕迹 ...

  6. 应急响应基础(三)——Windows日志分析

    Windows日志分析 一.Windows事件日志简介 1.Windows事件日志 Windows系统日志是记录系统中硬件.软件和系统问题的信息,同时还可以监视系统中发生的事件.用户可以通过它来检查错 ...

  7. 一款全面高效的日志分析工具,操作更简单

    一款全面高效的日志分析工具,操作更简单     Eventlog Analyzer是用来分析和审计系统及事件日志的管理软件,能够对全网范围内的主机.服务器.网络设备.数据库以及各种应用服务系统等产生的 ...

  8. EventLog Analyzer:功能丰富的事件日志管理软件

    Windows 设备是大多数企业网络中最受欢迎的选择.为了处理这些设备生成的数 TB 的事件日志数据,安全管理员可以使用EventLog Analyzer,这是一个强大的日志管理工具,提供端到端的事件 ...

  9. 【每天学习一点新知识】Windows日志分析

    一.日志分析概述 日志:日志文件为服务器.工作站.防火墙和应用软件等IT资源相关活动记录必要的.有价值的信息.日志文件中的记录可以提供以下用途:监控系统资源:审计用户行为:对可疑行为进行告警:确定入侵 ...

最新文章

  1. 企业级java b2bc商城系统开源源码二次开发(二十一)springboot集成JMS
  2. [Python图像处理] 四十一.Python图像平滑万字详解(均值滤波、方框滤波、高斯滤波、中值滤波、双边滤波)
  3. spark中各种数量的确定和查询(持续更新中)
  4. Mysql5.6.21源码安装
  5. jquery动画 -- 1.加载指示器
  6. 使背景图片适应不同分辨率电脑
  7. java 线程的join_多线程中join()
  8. 01.最简单的helloworld
  9. create user 'root'@'localhost' identified by 。。。
  10. 什么是黑盒测试,和白盒测试的区别有哪些?
  11. php 主机管理系统,LuManager虚拟主机管理系统
  12. 短信验证码接收app必须注意的那些事
  13. Matlab求出图像中每个细胞的细胞核与核仁面积之比代码
  14. 微信小程序 使用腾讯地图SDK详解及实现步骤
  15. iTOP3A5000_7A2000开发板龙芯全国产处理器LoongArch架构核心主板
  16. 数字中国理念引领国企人力资源数字化转型与实践
  17. 什么是IDOR(不安全的直接对象引用)
  18. 3D视觉基础(基本原理及3D传感器基本参数)
  19. 亿信华辰:主数据方案|构建黄金数据,实现降本提效
  20. java 企业网站源码模版 有前后台 springmvc SSM 生成静态化

热门文章

  1. Soul API 网关源码学习《二》
  2. 第七章 - 类的详细设计
  3. Unity 消息推送
  4. ubuntu18.04分辨率最高只有1024*768
  5. 【字符串处理】文明的复兴 words.pas/c/cpp/in/out
  6. 计算机课程成绩折算成百分制,百分制的分数怎么折算为GPA成绩
  7. Internet Download Manager6.41加速器最快的电脑工具下载器
  8. 毕业论文为什么要查重复率?
  9. 您必须应用的#1规则永远不会在Twitter或Facebook上被骗
  10. FPGA:zcu102学习笔记(参考自xing见博客)