3.统计年龄分布情况(5岁的间隔统计),绘制出年龄分布图。

第一个
这个和第一个非常相似,难点在于需要将出生年月转化为年龄。

data = data.copy()
data['年龄'] = [dt.datetime.today().year - i.year for i in pd.to_datetime(data["出生年月"])]

如果不添加data.copy()会报错

SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.Try using .loc[row_indexer,col_indexer] = value instead

完整代码:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import datetime as dt
# 读取 CSV文件生成DataFrame
df = pd.read_csv('D:/luohu3.csv')
print(df)print(df.info())   # 获取 DataFrame 的摘要
print(df.head())     # 根据位置返回对象的前n行信息(默认值为5) ,用于快速测试数据集
print(df.describe())   # 生成描述性统计数据,总结数据集分布的集中趋势,分散和形状,不包括 NaN值。
# 数据预处理
data = df.dropna(0)    # 删除所有包含空值的行或列
print(data.info())
# data = df.drop_duplicates()
# print(data.info())# 获取年龄数据
data = data.copy()
data['年龄'] = [dt.datetime.today().year - i.year for i in pd.to_datetime(data["出生年月"])]    # 日期数据如何处理
x = data["年龄"]
# 设置统计分值段范围
print(data.describe())       # 查看最大值与最小值
bins = np.arange(35, 65, 5)
time_bins = pd.cut(x, bins)    # 对数据进行离散化处理
print(time_bins)
# 按积分分割区间进行分组统计
df1 = data.groupby(time_bins)["年龄"].count()
print(df1)
# 绘制图形
df1.plot(kind="bar", rot=0)
plt.rcParams['font.sans-serif'] = ['Kaiti']   # 用来正常显示中文(黑体)常用字体包括: Kaiti-楷体; FangSong-仿宋; Microsoft YaHei-微软雅黑
plt.rcParams['axes.unicode_minus'] = False
plt.show()

统计年龄分布情况(5岁的间隔统计),绘制出年龄分布图。相关推荐

  1. 三人年龄 三个神秘蒙面人来访F博士。博士询问他们年龄时,他们说:我们中年龄最小的不超过19岁。我们3人年龄总和为70岁。且我们三人年龄的乘积是所有可能情况中最大的。

    package com.dati; public class test1 { /** * 2. 三人年龄 三个神秘蒙面人来访F博士. 博士询问他们年龄时,他们说:我们中年龄最小的不超过19岁.我们3人 ...

  2. Java中巧算年龄的代码,小学四年级奥数巧算年龄例题及练习题

    [导语]年龄问题是一类与计算有关的问题,它通常以和倍.差倍或和差等问题的形式出现.有些年龄问题往往是和.差.倍数等问题的综合,需要灵活地加以解决.以下是无忧考网整理的<小学四年级奥数巧算年龄例题 ...

  3. 【统计数据集GT的分布情况】

    # 1.统计数据集中小.中.大 GT的个数 # 2.统计某个类别小.中.大 GT的个数 # 3.统计数据集中ss.sm.sl GT的个数 import os from pathlib import P ...

  4. Sqlserver根据身份证号码查询年龄分布 籍贯分布DATEDIFF Case函数

    图表统计数据 Sql函数调用 项目记录 应用到的SQL Server 函数 SQL Server查询语句 本月新开,本月退场,在建项目,工人总数 查询30天内工人考勤情况 查询30天内工人进退场情况 ...

  5. 数据中心分布情况和业务占比分析

    我国数据中心的市场规模高速增长.受"互联网+".大数据战略.数字经济等国家政策的指引,以及云计算.移动互联网.物联网.大数据.人工智能等快速发展的驱动,我国数据中心的业务收入呈现连 ...

  6. 数理统计的统计量分布t分布_t分布:啤酒厂发现的关键统计概念

    数理统计的统计量分布t分布 by Kirill Dubovikov 通过基里尔·杜博维科夫(Kirill Dubovikov) t分布:啤酒厂发现的关键统计概念 (The t-distribution ...

  7. 去年购房者平均年龄为29.5岁 80后家庭人均居住面积最小

    近日,贝壳研究院发布了<2018年全国购房者调查报告>(以下简称<报告>),数据显示,2018年购房者平均年龄为29.5岁,对比全球各地,中国人的买房平均年龄更为年轻化.贝壳研 ...

  8. 中国互联网公司员工平均年龄出炉:平均年龄 27 到 33 岁

    10 月 6 日消息 据证券时报,脉脉数据研究院发布的调查.调查结果显示,大型互联网企业员工平均年龄从 27 岁到 33 岁不等. 从数据来看,阿里巴巴员工平均年龄 31 岁:百度员工平均年龄 30 ...

  9. 数据可视化ECharts:饼形图 1年龄分布模块制作

    - 官网找到类似实例, 适当分析,并且引入到HTML页面中 - 根据需求定制图表 定制图表需求1: - 修改图例组件在底部并且居中显示. - 每个小图标的宽度和高度修改为 10px - 文字大小为12 ...

最新文章

  1. 数据库系统概论:第四章 数据库安全性
  2. centos7删除符号链接_技术|在 Linux 中怎样移除(删除)符号链接
  3. varnish介绍以及虚拟机的封装
  4. poj 3131 双向搜索+hash判重
  5. java date 判断是否是今天_java——推断日期是否在今天之前
  6. IDEA写sql语句的时候没有提示信息的处理办法
  7. (篇六)C语言求自首数、完数、亲密数
  8. Ubuntu源码安装Nginx
  9. Hibernate怎么提升数据库查询的性能 (1)
  10. [转载]触摸屏网站制作的小细节
  11. knockout.js的简介和简单使用
  12. asp.net 动态生成二维码加文字描述或者二维码加logo
  13. webstorm汉化之后出现乱码现象
  14. win2019微软更新服务器,微软2019 Windows 10更新十一月版正式版推送
  15. xiecheng_spider携程民宿爬虫
  16. 支付设计白皮书:支付系统的总架构
  17. Zigbee网关 CC2530驱动1602显示屏
  18. oracle rollup 排序,Oracle分组函数之ROLLUP用法
  19. C#打字游戏案例(纯代码实现),新手入门必备!
  20. 复录比低的计算机学校,报考这15所学校要慎重!报录比30: 1, 每年刷掉大批人,太难考了!...

热门文章

  1. H5页面(微信也可)中调用手机拨打电话功能
  2. SpringBoot + uni-app开发企业级图书商城系统
  3. 对接环信踩坑记(环信客服+IMSDk即时通信)
  4. 用Python处理Excel中的重复行--菜鸟入门
  5. [HTML5-SVG]SVG是什么?SVG有什么用途?
  6. 算法珠玑算法总结(转)
  7. 《心流》| 精神熵和负熵
  8. 实现android wifi语音通话功能吗,Android下自写类似系统wifi管理功能的实现
  9. Android 框架MVP
  10. Java爬虫Jsoup爬取必应壁纸