【Python|Kaggle】机器学习系列之Pandas基础练习题(五)
前言
Hello!小伙伴!
非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~
自我介绍 ଘ(੭ˊᵕˋ)੭
昵称:海轰
标签:程序猿|C++选手|学生
简介:因C语言结识编程,随后转入计算机专业,有幸拿过一些国奖、省奖…已保研。目前正在学习C++/Linux/Python
学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!
初学Python 小白阶段
文章仅作为自己的学习笔记 用于知识体系建立以及复习
题不在多 学一题 懂一题
知其然 知其所以然!
往期推荐
【Python|Kaggle】机器学习系列之Pandas基础练习题(一)
【Python|Kaggle】机器学习系列之Pandas基础练习题(二)
【Python|Kaggle】机器学习系列之Pandas基础练习题(三)
【Python|Kaggle】机器学习系列之Pandas基础练习题(四)
Introduction
Run the following cell to load your data and some utility functions.
运行下面代码 导入此次练习需要的数据、库…
import pandas as pdreviews = pd.read_csv("../input/wine-reviews/winemag-data-130k-v2.csv", index_col=0)from learntools.core import binder; binder.bind(globals())
from learntools.pandas.data_types_and_missing_data import *
print("Setup complete.")
Exercises
1.
题目
What is the data type of the points
column in the dataset?
解答
题目意思:
查询points的类型
dtype = reviews.points.dtype
运行结果:
2.
题目
Create a Series from entries in the points
column, but convert the entries to strings. Hint: strings are str
in native Python.
解答
题目意思:
将points列中的数据类型转换为string
point_strings = reviews.points.astype('str')
运行结果:
3.
题目
Sometimes the price column is null. How many reviews in the dataset are missing a price?
解答
题目意思:
统计price列中nan的数量
n_missing_prices = pd.isnull(reviews.price).sum()
运行结果:
其余参考Demo:
n_missing_prices = reviews.price.isnull().sum()# ormissing_price_reviews = reviews[reviews.price.isnull()]
n_missing_prices = len(missing_price_reviews)
4.
题目
What are the most common wine-producing regions? Create a Series counting the number of times each value occurs in the region_1
field. This field is often missing data, so replace missing values with Unknown
. Sort in descending order. Your output should look something like this:
Unknown 21247
Napa Valley 4480...
Bardolino Superiore 1
Primitivo del Tarantino 1
Name: region_1, Length: 1230, dtype: int64
解答
题目意思:
首先需要将region_1中的空值用“unknown”填充
然后统计每一个地方的频率
reviews_per_region = reviews.region_1.fillna("Unknown").value_counts().sort_values(ascending=False)
运行结果:
结语
文章仅作为学习笔记,记录从0到1的一个过程
希望对您有所帮助,如有错误欢迎小伙伴指正~
我是 海轰ଘ(੭ˊᵕˋ)੭
如果您觉得写得可以的话,请点个赞吧
谢谢支持 ❤️
【Python|Kaggle】机器学习系列之Pandas基础练习题(五)相关推荐
- 【Python|Kaggle】机器学习系列之Pandas基础练习题(四)
前言 Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出- 自我介绍 ଘ(੭ˊᵕˋ)੭ 昵称:海轰 标签:程序猿|C++选手|学生 简介:因C语言结识编程,随后转入计 ...
- python数据科学系列:pandas入门详细教程
导读 前2篇分别系统性介绍了numpy和matplotlib的入门基本知识,今天本文自然是要对pandas进行入门详细介绍,通过本文你将系统性了解pandas为何会有数据分析界"瑞士军刀&q ...
- python字典经典例题_Python小白--------基础练习题(列表,元组,字典)
Python小白--------基础练习题(列表,元组,字典) 发布时间:2018-05-16 18:12, 浏览次数:1167 , 标签: Python 今天总结了这几天所学的基础知识,做了一些练习 ...
- python学习之数据分析(四):Pandas基础
文章目录 一.Pandas介绍: 1. Pandas介绍: 2.为什么要使用Pandas: 3. DataFrame: 4.DataFrame 4.1 DataFrame结构 4.2 DatatFra ...
- sklearn与机器学习系列专题之降维(五)一文弄懂Isomap特征筛选降维
目录 1.Isomap算法简介 2.Isomap算法原理 3.Isomap算法优缺点 4.python实战Isomap 5.下篇预告 1.Isomap算法简介 等度量映射(Isometric Feat ...
- python报表自动化系列 - 为pandas.DataFrame制作自然数索引(更改索引为从1开始的自然数)
更改DataFrame索引为从1开始的自然数 [函数说明] 实际上对于人来说更习惯于从零开始索引单元格,这样也不会容易出错.而建立一个DataFrame变量后默认索引是从零开始的,还有一些由于如导入等 ...
- Python快速上手系列--循环结构--基础篇
本篇将讲述前几章都有提起的循环,非常的重要,对于自动化测试的脚本来说,运用的都比较的频繁.好好看. if语句 首先我们先来学习一下if语句,因为它通常会和for循环搭配使用,频率极高. if 关键字或 ...
- python学习之路4(基础练习题)
1.下面哪些是操作符,哪些是值? * 'hello' -88.8 - / + 5 答:操作符包括 :* .-./.+:值包括:'hello'.-88.8.5 2.下面哪个是变量,哪个是字符串? spa ...
- 【机器学习基础】数学推导+纯Python实现机器学习算法30:系列总结与感悟
Python机器学习算法实现 Author:louwill Machine Learning Lab 终于到了最后的总结.从第一篇线性回归的文章开始到现在,已经接近有两年的时间了.当然,也不是纯写这3 ...
最新文章
- 《Netty 实战》Netty In Action中文版 第2章——你的第一款Netty应用程序(一)
- excel公式:逻辑与、逻辑或
- 重装机兵java_重装机兵之机甲咆哮
- Sql Server 2008将数据库导出sql脚本并导出数据
- yum 不能安装应用,提示There are no enabled repos Run yum repolist all
- 计算机桌面变成立体,win7系统将桌面变成立体桌面的两种方法介绍
- ​苏宁回应股权质押给淘宝:正常合作;苹果App Store被越狱商店指控垄断;Docker 20.10.0发布|极客日报...
- jni 调用sock_raw -- 端口扫描
- 开发移动网页应用的一些技术指导
- 留言板php数据库_PHP 留言板教程数据库表设计
- docker镜像下载到本地,并导入其他服务器
- CG100汽车编程器
- SpringBoot面试常问
- TCP长连接和短连接的区别(好文章!)
- Unity打安卓包 Android 所有错误解决方案大全(几乎囊括所有打包错误 )
- 视频编辑工具:添加水印、特效、音乐、导出视频、视频转gif
- html 手机登陆验证码,手机号登录(验证码).html
- NFC framework introduce(二)
- 018脑电图癫痫检测与预测算法综述(2014)
- 超屌的多线程锁分类,了解一下?