统计年龄分布情况(5岁的间隔统计),绘制出年龄分布图。
3.统计年龄分布情况(5岁的间隔统计),绘制出年龄分布图。
第一个
这个和第一个非常相似,难点在于需要将出生年月转化为年龄。
data = data.copy()
data['年龄'] = [dt.datetime.today().year - i.year for i in pd.to_datetime(data["出生年月"])]
如果不添加data.copy()会报错
SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.Try using .loc[row_indexer,col_indexer] = value instead
完整代码:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import datetime as dt
# 读取 CSV文件生成DataFrame
df = pd.read_csv('D:/luohu3.csv')
print(df)print(df.info()) # 获取 DataFrame 的摘要
print(df.head()) # 根据位置返回对象的前n行信息(默认值为5) ,用于快速测试数据集
print(df.describe()) # 生成描述性统计数据,总结数据集分布的集中趋势,分散和形状,不包括 NaN值。
# 数据预处理
data = df.dropna(0) # 删除所有包含空值的行或列
print(data.info())
# data = df.drop_duplicates()
# print(data.info())# 获取年龄数据
data = data.copy()
data['年龄'] = [dt.datetime.today().year - i.year for i in pd.to_datetime(data["出生年月"])] # 日期数据如何处理
x = data["年龄"]
# 设置统计分值段范围
print(data.describe()) # 查看最大值与最小值
bins = np.arange(35, 65, 5)
time_bins = pd.cut(x, bins) # 对数据进行离散化处理
print(time_bins)
# 按积分分割区间进行分组统计
df1 = data.groupby(time_bins)["年龄"].count()
print(df1)
# 绘制图形
df1.plot(kind="bar", rot=0)
plt.rcParams['font.sans-serif'] = ['Kaiti'] # 用来正常显示中文(黑体)常用字体包括: Kaiti-楷体; FangSong-仿宋; Microsoft YaHei-微软雅黑
plt.rcParams['axes.unicode_minus'] = False
plt.show()
统计年龄分布情况(5岁的间隔统计),绘制出年龄分布图。相关推荐
- 三人年龄 三个神秘蒙面人来访F博士。博士询问他们年龄时,他们说:我们中年龄最小的不超过19岁。我们3人年龄总和为70岁。且我们三人年龄的乘积是所有可能情况中最大的。
package com.dati; public class test1 { /** * 2. 三人年龄 三个神秘蒙面人来访F博士. 博士询问他们年龄时,他们说:我们中年龄最小的不超过19岁.我们3人 ...
- Java中巧算年龄的代码,小学四年级奥数巧算年龄例题及练习题
[导语]年龄问题是一类与计算有关的问题,它通常以和倍.差倍或和差等问题的形式出现.有些年龄问题往往是和.差.倍数等问题的综合,需要灵活地加以解决.以下是无忧考网整理的<小学四年级奥数巧算年龄例题 ...
- 【统计数据集GT的分布情况】
# 1.统计数据集中小.中.大 GT的个数 # 2.统计某个类别小.中.大 GT的个数 # 3.统计数据集中ss.sm.sl GT的个数 import os from pathlib import P ...
- Sqlserver根据身份证号码查询年龄分布 籍贯分布DATEDIFF Case函数
图表统计数据 Sql函数调用 项目记录 应用到的SQL Server 函数 SQL Server查询语句 本月新开,本月退场,在建项目,工人总数 查询30天内工人考勤情况 查询30天内工人进退场情况 ...
- 数据中心分布情况和业务占比分析
我国数据中心的市场规模高速增长.受"互联网+".大数据战略.数字经济等国家政策的指引,以及云计算.移动互联网.物联网.大数据.人工智能等快速发展的驱动,我国数据中心的业务收入呈现连 ...
- 数理统计的统计量分布t分布_t分布:啤酒厂发现的关键统计概念
数理统计的统计量分布t分布 by Kirill Dubovikov 通过基里尔·杜博维科夫(Kirill Dubovikov) t分布:啤酒厂发现的关键统计概念 (The t-distribution ...
- 去年购房者平均年龄为29.5岁 80后家庭人均居住面积最小
近日,贝壳研究院发布了<2018年全国购房者调查报告>(以下简称<报告>),数据显示,2018年购房者平均年龄为29.5岁,对比全球各地,中国人的买房平均年龄更为年轻化.贝壳研 ...
- 中国互联网公司员工平均年龄出炉:平均年龄 27 到 33 岁
10 月 6 日消息 据证券时报,脉脉数据研究院发布的调查.调查结果显示,大型互联网企业员工平均年龄从 27 岁到 33 岁不等. 从数据来看,阿里巴巴员工平均年龄 31 岁:百度员工平均年龄 30 ...
- 数据可视化ECharts:饼形图 1年龄分布模块制作
- 官网找到类似实例, 适当分析,并且引入到HTML页面中 - 根据需求定制图表 定制图表需求1: - 修改图例组件在底部并且居中显示. - 每个小图标的宽度和高度修改为 10px - 文字大小为12 ...
最新文章
- 数据库系统概论:第四章 数据库安全性
- centos7删除符号链接_技术|在 Linux 中怎样移除(删除)符号链接
- varnish介绍以及虚拟机的封装
- poj 3131 双向搜索+hash判重
- java date 判断是否是今天_java——推断日期是否在今天之前
- IDEA写sql语句的时候没有提示信息的处理办法
- (篇六)C语言求自首数、完数、亲密数
- Ubuntu源码安装Nginx
- Hibernate怎么提升数据库查询的性能 (1)
- [转载]触摸屏网站制作的小细节
- knockout.js的简介和简单使用
- asp.net 动态生成二维码加文字描述或者二维码加logo
- webstorm汉化之后出现乱码现象
- win2019微软更新服务器,微软2019 Windows 10更新十一月版正式版推送
- xiecheng_spider携程民宿爬虫
- 支付设计白皮书:支付系统的总架构
- Zigbee网关 CC2530驱动1602显示屏
- oracle rollup 排序,Oracle分组函数之ROLLUP用法
- C#打字游戏案例(纯代码实现),新手入门必备!
- 复录比低的计算机学校,报考这15所学校要慎重!报录比30: 1, 每年刷掉大批人,太难考了!...