导入需要的包:numpy、pandas

import numpy as py

import pandas as pd

创建一个表:

  • df = pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006],
  • "date":pd.date_range('20130102', periods=6),
  • "city":['Beijing ', 'SH', ' guangzhou ', 'Shenzhen', 'shanghai', 'Beijing '],
  • "age":[23,44,54,32,34,32],
  • "category":['100-A','100-B','110-A','110-C','210-A','130-F'],
  • "price":[1200,np.nan,2133,5433,np.nan,4432]},
  • columns =['id','date','city','category','age','price'])
  • 得到如下表:

Python处理重复数据

drop_duplicates函数删除重复值。以city列为例,city字段中存在重复值。默认情况下drop_duplicates()将删除后出现的重复值。增加keep=‘last’参数后将删除最先出现的重复值,保留最后的值。下面是具体的代码和比较结果。

df["city"].drop_duplicates()

保留先出现的重复值
保留后面出现的重复值

数据的替换和修改

Python中使用replace函数实现数据替换。数据表中city字段上海存在两种写法,分别为shanghai和SH。我们使用replace函数对SH进行替换。

替换值

数据表合并

首先是对不同的数据表进行合并,我们这里创建一个新的数据表df1,并将df和df1两个数据表进行合并。python中通过merge函数一次性实现。下面建立df1数据表,用于和df数据表进行合并。

  • df1=pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006,1007,1008],
  • "gender":['male','female','male','female','male','female','male','female'],
  • "pay":['Y','N','Y','Y','N','Y','N','Y',],
  • "m-point":[10,12,20,40,40,40,30,20]})

使用merge函数对两个数据表进行合并:

用inner方式合并

除了inner方式以外,合并的方式还有left,right和outer方式。只要在how=“left/right/outer”

python dataframe 合并乱序列表_Python数据处理--删除重复项、数值替换和表合并相关推荐

  1. python删除两个excel表中的相同元素_Python数据处理--删除重复项、数值替换和表合并...

    导入需要的包:numpy.pandas import numpy as py import pandas as pd 创建一个表:df = pd.DataFrame({"id":[ ...

  2. python集合如何去除重复数据_Python 迭代删除重复项,集合删除重复项

    1. 迭代删除重复项:先排序列表项,然后通过新迭代(not in)去除重复项,分片打印 def sanitize(time_string): if '-' in time_string: splitt ...

  3. python 字典添加元素乱序了_Python有序字典的两个小“惊喜”

    从 Python 3.6 开始,常规的字典会记住其插入的顺序:就是说,当遍历字典时,你获得字典中元素的顺序跟它们插入时的顺序相同. 在 3.6 之前,字典是无序的:遍历顺序是随机的. 关于有序字典,这 ...

  4. 如何在保留订单的同时从列表中删除重复项?

    是否有内置的程序在保留顺序的同时从Python列表中删除重复项? 我知道我可以使用集合来删除重复项,但这会破坏原始顺序. 我也知道我可以这样滚动自己: def uniq(input):output = ...

  5. python列表去重并删除重复那个_Python实现去除列表中重复元素的方法总结【7种方法】...

    如何用python实现剔除列表中相同的元素 >>> a = [1, 2, 3, 1, 2, 3] >>> list(set(a)) [1, 2, 3] 先转成 se ...

  6. python从后面删除重复项_如何从Python列表中删除重复项

    如何从Python列表中删除重复项 了解如何从Python中的List中删除重复项技巧. 实例 从列表中删除任何重复项: mylist = ["a", "b", ...

  7. python dataframe删除重复行_2.3.10 DataFrame 查看删除重复项

    1.查看重复项 df.duplicated() df.duplicated(subset=['python','java','C'],keep='first') 参数:subset 特定列有重复项才会 ...

  8. python去掉字典重复项_从字典列表中删除重复项python

    我正在尝试从下面的列表中删除重复项distinct_cur = [{'rtc': 0, 'vf': 0, 'mtc': 0, 'doc': 'good job', 'foc': 195, 'st': ...

  9. 6种在 Python 中从 List 中删除重复项的方法

    来源 | https://medium.com/@cookbug/six-ways-to-remove-duplicates-from-list-in-python-970d998b1384 翻译 | ...

最新文章

  1. 新兴解决方案增强了电动汽车电源(功耗)管理
  2. android + javascript 相互通信实例分析
  3. Linux基础第四课——文件操作
  4. 算法工程师思维导图—数据结构与算法
  5. OpenCV人脸识别之三:识别自己的脸
  6. Junit中的异常测试
  7. 如何成为Java开发工程师?
  8. Micropython教程之TPYBoard开发板制作电子时钟(萝卜学科编程教育)
  9. FME数据转换教程——MapGIS .WL/WP 转ArcGIS .Shp
  10. SAP QM 特性导出及定性定量
  11. OpenWrt 安装中文语言包
  12. android rn热更新闪退,react-native 导致热更新失败的问题之一
  13. android 百度地图
  14. [HDU5956]The Elder
  15. matlab的shading,matlab colormap,caxis,shading,hsv,pcolor, alpha
  16. SCRM升级--企业微信数字营销解决方案
  17. cerebro安装部署
  18. html5小游戏跑,HTML5 Speedster 小游戏(高速跑跳过关)
  19. NYOJ1237 第八届acm省赛 B最大岛屿
  20. Hive查询系列之初相识

热门文章

  1. 性能计数器驱动_Linux CPU性能优化方法
  2. 多功能计算机如何关闭,多功能的计算机显示终端
  3. 你知道这5年我怎么过的吗!谈谈我做测试开发的这些年……【总结】
  4. keras如何在验证集加噪声_Keras从时域、频域处理音频分类问题(带详细注释)...
  5. 扇贝和不背单词_你还没找到中意的背单词APP?我都试过,我来帮你盘点盘点
  6. mysql tcmalloc jemalloc_tcmalloc jemalloc 和ptmalloc 对比
  7. java p=x,javap的简单理解
  8. mysql myisam表加索引_MyISAM和InnoDB的索引实现
  9. 各种机器学习和深度学习的中文微博情感分析
  10. 一等奖60万,首届“唱圆”杯AI翻译大赛报名中