#定义一个数组
res_list=[]
循环需要处理的数据
for i in test_1['review']:
#对应reres=re.sub("[^a-zA-Z]", " ",i)
#将处理后的数据传入新数组res_list.append(res)
#建立新dataframe
tab_2=pd.DataFrame(res_list,index=test_1.index,columns=['new_review'])
#与原始表合并
tab_3=test_1.join(tab_2)
#删除不需要的字段
tab_3=tab_3.drop(['review'],axis=1)

简单的一种方法

import re
def re_1(i):res=re.sub("[^a-zA-Z]", " ",i)return res
test_1['new_review'] = test_1.apply(lambda x: re_1(x['review']), axis = 1)

正则与pandas处理行数据相关推荐

  1. Python之Pandas:利用pandas实现行数据添加,即将字典格式的数据,按照行数据,从头开始循环添加到dataframe中

    Python之Pandas:利用pandas实现行数据添加,即将字典格式的数据,按照行数据,从头开始循环添加到dataframe中e中 目录 利用pandas实现行数据添加,即将字典格式的数据,按照行 ...

  2. pandas使用sort_values函数和groupby函数获取每个分组数值最小的前N行数据(n rows with smallest column value in each group)

    pandas使用sort_values函数和groupby函数获取每个分组数值最小的前N行数据(n rows with smallest column value in each group in d ...

  3. pandas使用read_csv函数读取文件最后N行数据并保留表头、pandas使用read_csv函数读取网络url链接数据

    pandas使用read_csv函数读取文件最后N行数据并保留表头.pandas使用read_csv函数读取网络url链接数据 目录

  4. pandas读取csv文件的前几行数据(nrows参数)、pandas读取csv文件的中间几行数据(skiprows=range(a,b))

    pandas读取csv文件的前几行数据(nrows参数).pandas读取csv文件的中间几行数据(skiprows=range(a,b)) 目录 pandas读取csv文件的前几行数据.pandas ...

  5. pandas计算dataframe数据行的均值(mean)实战:设置skipna=False则计算行均值时不会忽略NaN值

    pandas计算dataframe数据行的均值(mean)实战:设置skipna=False则计算行均值时不会忽略NaN值 目录

  6. Pandas常见的数据过滤方法、通过列条件筛选行数据

    Pandas常见的数据过滤方法.通过列条件筛选行数据 不废话了,直接看代码吧: 一般情况下,前面5种就覆盖了绝大多数需求 import pandas as pd import numpy as npd ...

  7. python 列表多行_Python Pandas list列表数据列拆分成多行的方法实现

    1.实现的效果 示例代码: df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] ...

  8. Py之pandas:利用pandas工具输出每行的索引值、及其对应的行数据

    Py之pandas:利用pandas工具输出每行的索引值.及其对应的行数据 目录 利用pandas工具输出每行的索引值.及其对应的行数据 输出结果 实现代码 利用pandas工具输出每行的索引值.及其 ...

  9. python的pandas库中如何计算每列出现最多的值_Python Pandas中根据列的值选取多行数据...

    Pandas中根据列的值选取多行数据 # 选取等于某些值的行记录 用 == df.loc[df['column_name'] == some_value] # 选取某列是否是某一类型的数值 用 isi ...

  10. python选取列中数据的范围_Python Pandas中根据列的值选取多行数据

    Pandas中根据列的值选取多行数据 # 选取等于某些值的行记录 用 == df.loc[df['column_name'] == some_value] # 选取某列是否是某一类型的数值 用 isi ...

最新文章

  1. Senparc.Weixin.MP SDK 微信公众平台开发教程(十一):高级接口说明
  2. 2022年春季学期课程基本信息总汇
  3. NHibernate——Criteria条件查询
  4. Linux中如何用命令打开文件夹
  5. 千亿市场竟是蓝海——在线音乐教学产品观察
  6. python从基础到入门电子书_零基础如何学好python?一本python从入门到实践电子书籍赠送...
  7. 多态的概念、对象上下转型、多态的应用、异常(异常概念、异常分类、java异常处理机制、try...catch...finally、throw和throws、自定义异常)
  8. asp.net core 发布到 docker 容器时文件体积过大及服务端口的配置疑问
  9. 嵌套For循环性能优化
  10. Mysql梳理(单表查询)
  11. KVM-Arch-Figure
  12. erl_0016 《硝烟中的erlang》 读书笔记003 “error_logger 爆炸”
  13. 文件缓存、内存缓存与静态化页面的取舍
  14. Windows 7安装 Visual Studio 2010之大战三大回合
  15. 手机U盘制作成系统启动盘后在手机端无法识别
  16. php开发电脑i56200u,八代酷睿处理器好不好?i5-6200U处理器/i5-8250U处理器对比评测...
  17. 如何利用百度知道推广网站
  18. 2011 imac 固态_老款iMac 安装SSD固态硬盘
  19. 解密库尔勒可靠性检测
  20. 线稿图视频制作补充(调整视频亮度、对比度;删除无用文件)

热门文章

  1. OpenGL入门学习 课程 (三) 绘制几何图形的一些细节问题
  2. SVM入门(一)至(三)(转)
  3. 装饰模式/适配器模式/代理模式
  4. 带修改离线主席树 + 树状数组 ZOJ - 2112【Dynamic Rankings】
  5. 转载AWS 基础知识
  6. PythonDay7
  7. 斗战神 刷图电罗刹攻略
  8. jquery-pager的使用
  9. 将 varchar 值转换为数据类型为 int 的列时发生语法错误
  10. 关于Qt学习之路2:8、添加动作 这一节课 发现里面的程序运行后没有图标