前言

Hello!小伙伴!
非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~
 
自我介绍 ଘ(੭ˊᵕˋ)੭
昵称:海轰
标签:程序猿|C++选手|学生
简介:因C语言结识编程,随后转入计算机专业,有幸拿过一些国奖、省奖…已保研。目前正在学习C++/Linux/Python
学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!
 
初学Python 小白阶段
文章仅作为自己的学习笔记 用于知识体系建立以及复习
题不在多 学一题 懂一题
知其然 知其所以然!

往期推荐

【Python|Kaggle】机器学习系列之Pandas基础练习题(一)

【Python|Kaggle】机器学习系列之Pandas基础练习题(二)

【Python|Kaggle】机器学习系列之Pandas基础练习题(三)

【Python|Kaggle】机器学习系列之Pandas基础练习题(四)

Introduction

Run the following cell to load your data and some utility functions.

运行下面代码 导入此次练习需要的数据、库…

import pandas as pdreviews = pd.read_csv("../input/wine-reviews/winemag-data-130k-v2.csv", index_col=0)from learntools.core import binder; binder.bind(globals())
from learntools.pandas.data_types_and_missing_data import *
print("Setup complete.")

Exercises

1.

题目

What is the data type of the points column in the dataset?

解答

题目意思:

查询points的类型

dtype = reviews.points.dtype

运行结果:

2.

题目

Create a Series from entries in the points column, but convert the entries to strings. Hint: strings are str in native Python.

解答

题目意思:

将points列中的数据类型转换为string

point_strings = reviews.points.astype('str')

运行结果:

3.

题目

Sometimes the price column is null. How many reviews in the dataset are missing a price?

解答

题目意思:

统计price列中nan的数量

n_missing_prices = pd.isnull(reviews.price).sum()

运行结果:

其余参考Demo:

n_missing_prices = reviews.price.isnull().sum()# ormissing_price_reviews = reviews[reviews.price.isnull()]
n_missing_prices = len(missing_price_reviews)

4.

题目

What are the most common wine-producing regions? Create a Series counting the number of times each value occurs in the region_1 field. This field is often missing data, so replace missing values with Unknown. Sort in descending order. Your output should look something like this:

Unknown                    21247
Napa Valley                 4480...
Bardolino Superiore            1
Primitivo del Tarantino        1
Name: region_1, Length: 1230, dtype: int64

解答

题目意思:

首先需要将region_1中的空值用“unknown”填充
然后统计每一个地方的频率

reviews_per_region = reviews.region_1.fillna("Unknown").value_counts().sort_values(ascending=False)

运行结果:

结语

文章仅作为学习笔记,记录从0到1的一个过程

希望对您有所帮助,如有错误欢迎小伙伴指正~

我是 海轰ଘ(੭ˊᵕˋ)੭

如果您觉得写得可以的话,请点个赞吧

谢谢支持 ❤️

【Python|Kaggle】机器学习系列之Pandas基础练习题(五)相关推荐

  1. 【Python|Kaggle】机器学习系列之Pandas基础练习题(四)

    前言 Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出-   自我介绍 ଘ(੭ˊᵕˋ)੭ 昵称:海轰 标签:程序猿|C++选手|学生 简介:因C语言结识编程,随后转入计 ...

  2. python数据科学系列:pandas入门详细教程

    导读 前2篇分别系统性介绍了numpy和matplotlib的入门基本知识,今天本文自然是要对pandas进行入门详细介绍,通过本文你将系统性了解pandas为何会有数据分析界"瑞士军刀&q ...

  3. python字典经典例题_Python小白--------基础练习题(列表,元组,字典)

    Python小白--------基础练习题(列表,元组,字典) 发布时间:2018-05-16 18:12, 浏览次数:1167 , 标签: Python 今天总结了这几天所学的基础知识,做了一些练习 ...

  4. python学习之数据分析(四):Pandas基础

    文章目录 一.Pandas介绍: 1. Pandas介绍: 2.为什么要使用Pandas: 3. DataFrame: 4.DataFrame 4.1 DataFrame结构 4.2 DatatFra ...

  5. sklearn与机器学习系列专题之降维(五)一文弄懂Isomap特征筛选降维

    目录 1.Isomap算法简介 2.Isomap算法原理 3.Isomap算法优缺点 4.python实战Isomap 5.下篇预告 1.Isomap算法简介 等度量映射(Isometric Feat ...

  6. python报表自动化系列 - 为pandas.DataFrame制作自然数索引(更改索引为从1开始的自然数)

    更改DataFrame索引为从1开始的自然数 [函数说明] 实际上对于人来说更习惯于从零开始索引单元格,这样也不会容易出错.而建立一个DataFrame变量后默认索引是从零开始的,还有一些由于如导入等 ...

  7. Python快速上手系列--循环结构--基础篇

    本篇将讲述前几章都有提起的循环,非常的重要,对于自动化测试的脚本来说,运用的都比较的频繁.好好看. if语句 首先我们先来学习一下if语句,因为它通常会和for循环搭配使用,频率极高. if 关键字或 ...

  8. python学习之路4(基础练习题)

    1.下面哪些是操作符,哪些是值? * 'hello' -88.8 - / + 5 答:操作符包括 :* .-./.+:值包括:'hello'.-88.8.5 2.下面哪个是变量,哪个是字符串? spa ...

  9. 【机器学习基础】数学推导+纯Python实现机器学习算法30:系列总结与感悟

    Python机器学习算法实现 Author:louwill Machine Learning Lab 终于到了最后的总结.从第一篇线性回归的文章开始到现在,已经接近有两年的时间了.当然,也不是纯写这3 ...

最新文章

  1. 《Netty 实战》Netty In Action中文版 第2章——你的第一款Netty应用程序(一)
  2. excel公式:逻辑与、逻辑或
  3. 重装机兵java_重装机兵之机甲咆哮
  4. Sql Server 2008将数据库导出sql脚本并导出数据
  5. yum 不能安装应用,提示There are no enabled repos Run yum repolist all
  6. 计算机桌面变成立体,win7系统将桌面变成立体桌面的两种方法介绍
  7. ​苏宁回应股权质押给淘宝:正常合作;苹果App Store被越狱商店指控垄断;Docker 20.10.0发布|极客日报...
  8. jni 调用sock_raw -- 端口扫描
  9. 开发移动网页应用的一些技术指导
  10. 留言板php数据库_PHP 留言板教程数据库表设计
  11. docker镜像下载到本地,并导入其他服务器
  12. CG100汽车编程器
  13. SpringBoot面试常问
  14. TCP长连接和短连接的区别(好文章!)
  15. Unity打安卓包 Android 所有错误解决方案大全(几乎囊括所有打包错误 )
  16. 视频编辑工具:添加水印、特效、音乐、导出视频、视频转gif
  17. html 手机登陆验证码,手机号登录(验证码).html
  18. NFC framework introduce(二)
  19. 018脑电图癫痫检测与预测算法综述(2014)
  20. 超屌的多线程锁分类,了解一下?

热门文章

  1. 百度地图定位经纬度返回4.9E-324有关问题
  2. 【虚拟机】虚拟化架构与系统部署(Windows系统安装)
  3. 字符串长度测量,大小比较
  4. 4.5 小红书博主如何跟商家合作?【玩赚小红书】
  5. Microsoft Word 教程「4」,如何在 Word 中应用样式、主题?
  6. nodeJS打包安装和问题处理
  7. 我看无损音频APE和FLAC
  8. 用matlab如何拟合曲线,用MATLAB怎么实现曲线拟合?
  9. 国际象棋棋盘 java_java打印国际象棋棋盘的方法
  10. 实用的签到、日程表日历控件(可扩展)