测试集大小:

test.shape

(898, 11)

对某列的字符串做统计长度

1、for遍历法:

start = time.time()
for i in test.index.values:test.loc[i,'contentLen1'] = len(test.loc[i,'content'])
time.time() - start

47.16238021850586

2、使用pandas的内置方法.str

%time test['contentLen2'] = test['content'].str.len()

Wall time: 61 ms

结论

上面例子可以得出,使用pandas时千万不要盲目的使用for遍历,要学会使用pandas提供的内置方法。

for和.str方法之间的性能差距过大,不在一个数量级。使用for会造成频繁的赋值操作,造成不必要内存消耗和计算时长。

以上测试用例才898行,for的赋值耗时高达47秒,生产上的都是几百万行的数据,使用for那不就直接凉凉了?

且行且珍惜啊!

【Pandas】Pandas求某列字符串的长度,总结经验教训相关推荐

  1. C++中求string类型字符串的长度的方法

    在代码中经常会求字符串的有效长度,对char型字符串数组大家会用strlen来求它的有效长度,如何求string类型字符串的有效长度呢?这里有三种方法. (1)使用string的成员函数length( ...

  2. 实现gridview中checkbox的全选和反选,以及固定gridview列字符串的长度,多余的以...表示...

    下面是源码: 先添加js和CSS <script type="text/javascript" language="javascript">     ...

  3. 字符串的长度和字符串数据的长度,length和length()

    java中在求数组或者字符串的长度的时候,用到length的时候,有时候是length,有时候是length(),很是奇怪,于是上API查了一下,发现一些小细节. 首先看看这段代码: public c ...

  4. pandas使用query函数基于dataframe字符串数据列中字符串的长度筛选dataframe的数据行(specific column string length)

    pandas使用query函数基于dataframe字符串数据列中字符串的长度筛选dataframe的数据行(select dataframe rows based on specific colum ...

  5. 对比python字符串函数,学习pandas的str矢量化字符串函数

    1.概述 python字符串应该是python里面最重要的数据类型了,因此学会怎么处理各种各样的字符串,显得尤为重要. 我们不仅要学会怎么处理单个字符串,这个就需要学习"python字符串函 ...

  6. C语言试题三十三之比较两个字符串的长度,(不得调用c语言提供的求字符串长度的函数),函数返回较长的字符串。若两个字符串长度相同,则返回第一个字符串。

    1. 题目 请编写函数function,它的功能是:比较两个字符串的长度,(不得调用c语言提供的求字符串长度的函数),函数返回较长的字符串.若两个字符串长度相同,则返回第一个字符串. 2 .温馨提示 ...

  7. python pandas 分割DataFrame中的字符串及元组

    python pandas 分割DataFrame中的字符串类型数据的方法 文章目录 1.使用str.split()方法 2.使用join()与split()方法结合 3. 使用apply方法分割元组 ...

  8. pandas读取多个文件内容为dataframe、并合并为一个dataframe、pandas创建仅有列标签而内容为空的dataframe

    pandas读取多个文件内容为dataframe.并合并为一个dataframe.pandas创建仅有列标签而内容为空的dataframe 目录

  9. pandas计算dataframe两列数据值相等的行号、取出DataFrame中两列值相等的行号

    pandas计算dataframe两列数据值相等的行号.取出DataFrame中两列值相等的行号 目录 pandas计算dataframe两列数据值相等的行号.取出DataFrame中两列值相等的行号

  10. pandas获取dataframe数据列的数据类型、获取dataframe每类数据类型数据列的个数、使用select_dtypes函数、include参数以及exclude参数按照数据类型筛选数据

    pandas获取dataframe数据列的数据类型.获取dataframe每类数据类型数据列的个数.使用select_dtypes函数.include参数以及exclude参数按照数据类型筛选数据 目 ...

最新文章

  1. 高斯混合模型--GMM(Gaussian Mixture Model)
  2. pythonnamedtuple定义类型_详解Python中namedtuple的使用
  3. C语言的指针初始化特别注意一点
  4. 9. OD-PEID的入门及BASIC(VB)开发的程序破解
  5. 剪花布条(HDU-2087)
  6. Centos7 安装 Python3.9
  7. 【年度重磅】2020华为云社区年度技术精选合集,700页+免费下载!
  8. Mac下python3配置Sklearn
  9. NSArray 所有基础点示例
  10. linux lsattr命令: 显示文件属性
  11. 如何在macOS中关闭优化电池充电功能?
  12. 在iPad/iPhone上使用Firebug
  13. Java删除文件夹下所有文件
  14. V20变频器手自动切换(就地远程切换)的具体方法示例
  15. STM32F407单片机移植ADS1115驱动程序
  16. (五)什么是软件架构视图 4+1视图
  17. 将一个真分数分解为埃及分数相加的形式
  18. Android BLE GATT CONN LMP TIMEOUT 0x22
  19. 第一课:初识Java
  20. PHP时间戳和日期的相互转换

热门文章

  1. 浏览器清除缓存[chrome、ie]
  2. 云呐IT服务台在企业IT管理中的作用
  3. 全国青少年软件编程等级考试标准 (预备级)1-4级
  4. 四六级成绩还可以这样查?Python助你装B一步到位!!!
  5. 调用微信接口实现微信授权登陆主体内容【code换取openid以及session_key】
  6. mac 无法删除用户
  7. Chromecast 播放电脑本地视频
  8. python关闭指定浏览器页面_Python自动关闭浏览器关闭网页的方法
  9. 创业和创业团队的感想感悟
  10. 海军某训练基地落户上海崇明岛 建设用地2500亩