↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习,不错过

Datawhale干货

作者:Frank Andrade,译者:张峰

众所周知,编写Python代码在开始时十分容易,但随着你在工具包中添加更多的库,你的脚本可能会有不必要的代码行,变得冗长而混乱。可能短期内能够应付工作,但长期来看,麻烦不小。

在这篇文章中,我将与你分享7个技巧,使你在使用Python进行数据科学时更加简洁。这涵盖了我们日常所做的事情,例如修改Pandas数据框中的值,连接字符串,读取文件等操作!

1. 使用Lambda来修改Pandas数据框中的值

假设我们有以下df数据框:

data = [[1,2,3], [4,5,6], [7,8,9]]
df = pd.DataFrame(data, columns=[0,1,2])
IN[1]: print (df)
OUT[1]:    0  1  20  1  2  31  4  5  62  7  8  9

现在由于某种原因,你需要在第0列的数字上添加01的值。一个常见的方法是定义一个函数来完成这个任务,然后用 apply 函数来修改一列的值。

def add_numbers(x):return f'{x}01'
df[0] = df[0].apply(add_numbers)
IN[1]: print (df)
OUT[1]:     0   1   20  101  2   31  401  5   62  701  8   9

这并不复杂,但是在数据框中对每一个改变创建一个函数是不切实际的。这时lambda就派上了用场。

lambda函数类似于普通的Python函数,但它可以不使用名称来定义,这使得它成为一个漂亮的单行代码。之前使用的代码可以用以下方式来减少。

df[0] = df[0].apply(lambda x:f'{x}01')

当你不知道是否可以访问一个系列的属性来修改数据时,Lambda变得非常有用。

例如,列0包含字母,我们想把它们大写。

# 如果你知道.str的存在,你可以这样做
df[0] = df[0].str.title()
# 如果你不知道.str,你仍然可以用lambda大写
df[0] = df[0].apply(lambda x: x.title())

2. 使用f-string来连接字符串

字符串连接是Python中非常常见的操作,它可以用不同的方法来完成。最常见的方法是使用+运算符;然而,这个运算符的一个问题是我们不能在字符串之间添加任何分隔符。

当然,如果你想把 "Hello "和 "World "连接起来,一个典型的变通方法是添加一个空白分隔符(" ")。

print("Hello" + " " + "World")

这就完成了工作,但为了写出更可读的代码,我们可以用一个f-string来代替它。

IN[2]: print(f'{Hello} {World}')
OUT[2]: "Hello World"

在一个基本的例子中,这似乎是不必要的,但是当涉及到连接多个值时(正如你将在提示#3中看到的),f-string将使你免于书写多次+ " " +。我不知道过去有多少次不得不写+运算符,但现在不会了!

其他连接字符串的方法是使用join()方法或format()函数,然而f-string在字符串连接方面做得更好。

3. 用Zip()函数对多个列表进行迭代

你是否曾经想在 Python 中循环遍历一个以上的列表?当你有两个列表时,你可以用 enumerate 来实现。

teams = ['Barcelona', 'Bayern Munich', 'Chelsea']
leagues = ['La Liga', 'Bundesliga', 'Premiere League']
for i, team in enumerate(teams):league = leagues[i]print(f'{team} plays in {league}')

然而,当你有两个或更多的列表时,这变得不切实际。一个更好的方法是使用zip()函数。zip()函数接收迭代数据,将它们聚集在一个元组中,并返回之。

让我们再增加一个列表,看看zip()的威力!

teams = ['Barcelona', 'Bayern Munich', 'Chelsea']
leagues = ['La Liga', 'Bundesliga', 'Premiere League']
countries = ['Spain', 'Germany', 'UK']
for team, league, country in zip(teams, leagues, countries):print(f'{team} plays in {league}. Country: {country}')

上述代码的输出结果为:

Barcelona plays in La Liga. Country: Spain
Bayern Munich plays in Bundesliga. Country: Germany
Chelsea plays in Premiere League. Country: UK

此处你注意到我们在这个例子中使用了f-string吗?代码变得更有可读性,不是吗?

4. 使用列表理解法

清洗和处理数据的一个常见步骤是修改现有的列表。比如,我们有以下需要大写的列表:

words = ['california', 'florida', 'texas']

将words列表的每个元素大写的典型方法是创建一个新的大写列表,执行一次 for 循环,使用.title(),然后将每个修改的值附加到新的列表中。

capitalized = []
for word in words:capitalized.append(word.title())

然而,Pythonic的方法是使用列表理解来做到这一点。列表理解有一种优雅的方法来制作列表。

你可以用一行代码重写上面的for循环:

capitalized = [word.title() for word in words]

由此我们可以跳过第一个例子中的一些步骤,结果是一样的。

5. 对文件对象使用with语句

当在一个项目上工作时,我们经常会对文件进行读写操作。最常见的方法是使用open()函数打开一个文件,它会创建一个我们可以操作的文件对象,然后作为一个习惯的做法,我们应该使用close()关闭该文件对象。

f = open('dataset.txt', 'w')
f.write('new_data')
f.close()

这很容易记住,但有时写了几个小时的代码,我们可能会忘记用f.close()关闭f文件。这时,with语句就派上了用场。with语句将自动关闭文件对象f,形式如下:

with open('dataset.txt', 'w') as f:f.write('new_data')

有了这个,我们可以保持代码的简短。

你不需要用它来读取CSV文件,因为你可以用pandas的 pd.read_csv()轻松地读取,但在读取其他类型的文件时,这仍然很有用。例如,从pickle文件中读取数据时经常使用它。

import pickle
# 从pickle文件中读取数据集
with open(‘test’, ‘rb’) as input:data = pickle.load(input)

6. 停止使用方括号来获取字典项, 利用.get()代替

比如,有以下一个字典:

person = {'name': 'John', 'age': 20}

我们可以通过person[name]person[age]分别获得姓名和年龄。但是,由于某种原因,我们想获得一个不存在的键,如 "工资",运行person[salary]会引发一个`KeyError'。

这时,get()方法就有用了。如果键在字典中,get()方法返回指定键的值,但是如果没有找到键,Python 将返回None。得益于此,你的代码不会中断。

person = {'name': 'John', 'age': 20}
print('Name: ', person.get('name'))
print('Age: ', person.get('age'))
print('Salary: ', person.get('salary'))

输出结果如下:

Name:  John
Age:  20
Salary:  None

7. 多重赋值

你是否曾想减少用于创建多个变量、列表或字典的代码行数?那么,你可以用多重赋值轻松做到这一点。

# 原始操作
a = 1
b = 2
c = 3
# 替代操作
a, b, c = 1, 2, 3
# 代替在不同行中创建多个列表
data_1 = []
data_2 = []
data_3 = []
data_4 = []
# 可以在一行中创建它们的多重赋值
data_1, data_2, data_3, data_4 = [], [], [], []
# 或者使用列表理解法
data_1, data_2, data_3, data_4 = [[] for i in range(4)]

原文链接:

https://towardsdatascience.com/7-tips-to-level-up-your-python-code-for-data-science-4a64dbccd86d

整理不易,三连

让Python代码简洁的实用技巧!相关推荐

  1. 三周写出高性能的Python代码,这些小技巧你值得一试。

    1一个不上进的 Python 使用者 我是一个有 C 语言背景的开发者.最近转做了 Python,平时用 Python 还算 6,这周在给新员工分享工作之后,有个小孩跑来问我:"哥,你是学 ...

  2. 值得收藏!编写干净的 Python 代码的 5 个技巧

    平时是否思考过如何编写干净的 Python 代码吗? 今天我将给大家分享五个技巧,确保你的代码正常工作.易于阅读并充分利用 Python 提供的功能模块. 使用易于记忆的变量名 通常在编程时,我们不会 ...

  3. 30 段极简 Python 代码:这些小技巧你都 Get 了么?

    选自 | towardsdatascienc 编译 | 机器之心 学 Python 怎样才最快,当然是实战各种小项目,只有自己去想与写,才记得住规则.本文是 30 个极简任务,初学者可以尝试着自己实现 ...

  4. 30段极简Python代码:这些小技巧你都Get了么(附代码链接)

    来源:机器之心 本文约3200字,建议阅读8分钟. 本文带你了解30个极简任务,它们都是平常非常实用的技巧,我们只要花几分钟就能从头到尾浏览一遍. 学 Python 怎样才最快,当然是实战各种小项目, ...

  5. 30段极简Python代码:这些小技巧你都Get了么

    学 Python 怎样才最快,当然是实战各种小项目,只有自己去想与写,才记得住规则.本文是 30 个极简任务,初学者可以尝试着自己实现:本文同样也是 30 段代码,Python 开发者也可以看看是不是 ...

  6. 30段极简Python代码:这些小技巧你都Get了么?

    Python 是机器学习最广泛采用的编程语言,它最重要的优势在于编程的易用性.如果读者对基本的 Python 语法已经有一些了解,那么这篇文章可能会给你一些启发.作者简单概览了 30 段代码,它们都是 ...

  7. python重复元素判定_20段极简Python代码:这些小技巧你都Get了么

    ↑↑↑ 点击上方蓝字,关注极客猴 如果你喜欢极客猴,可以把我置顶或星标~ 选自 | towardsdatascience转自 | 机器之心 Python 是机器学习最广泛采用的编程语言,它最重要的优势 ...

  8. python重复元素判定_30段极简Python代码:这些小技巧你都Get了么

    选自 | towardsdatascience转自 | 机器之心 Python 是机器学习最广泛采用的编程语言,它最重要的优势在于编程的易用性.如果读者对基本的 Python 语法已经有一些了解,那么 ...

  9. python中modify的用法_30段极简Python代码:这些小技巧你都Get了么

    学 Python 怎样才最快,当然是实战各种小项目,只有自己去想与写,才记得住规则.本文是 30 个极简任务,初学者可以尝试着自己实现:本文同样也是 30 段代码,Python 开发者也可以看看是不是 ...

最新文章

  1. 求集合/字符串中的所有组合 (C语言)
  2. antd table设置表格一个单元格的字体颜色_微软Office三件套,各有一个效率神器,全都知道的人不超过1%...
  3. 【实用技能】通过sh脚本动态上传项目到github
  4. MySQL源码学习:MySQL中禁止跨库访问的实现
  5. java mock什么意思_java @Mock, @MockBean 与 Mockito.mock( ) 之间的差异
  6. python逐行写入csv_python将列表按行写入csv
  7. MFC开发-MFC 树控件 将一棵树全部展开
  8. 技术领导者携力为数据中心和其它市场带来开放的加速架构
  9. Autofs自动挂在实现
  10. JMH(java代码的微基准测试)入门和汇总
  11. 用计算机打出5201 314文字,怎么识别书上或照片中的文字并保存为电子版?
  12. 三端稳压管怎么接线及方法说明
  13. 文献 | 一眨眼就错过了的心理机制
  14. 什么类型的APP适合推广
  15. 舒老师AK的hu测 T1. 迷失沃尔玛(dp+贪心)
  16. 主力吸筹猛攻指标源码_主力吸筹猛攻指标源码_股市吸筹
  17. vue3使用vuedraggable实现拖拽
  18. 奔三之际,任性一把 ——从华为南研所裸辞后的一些体会和感想
  19. 服务器三种常见的限流算法
  20. 论文——多指标与机器学习算法相结合的中国县级玉米产量早期预测

热门文章

  1. SQL执行并返回执行前/后结果
  2. DB天气app冲刺二阶段第十一天(完结)
  3. extjs grid renderer用法
  4. 【青少年编程】【四级】数字之和
  5. 【数据结构】顺序表的应用(2)(C语言)
  6. 使复选框选中_勾选复选框单元格变色,自动计数,在Excel中是如何实现的?
  7. 懒人神器 !一个创意十足的 Python 命令行工具
  8. 自动化神经网络理论进展缓慢,AutoML算法的边界到底在哪?
  9. 数十名工程师作战5天,阿里达摩院连夜研发智能疫情机器人
  10. PyTorch实现L2和L1正则化的方法 | CSDN博文精选