python csv文件比较

  • CSV文件比较

CSV文件比较

  • 可以比较同一行内容
  • 可以比较不同行内容
import pandas as pddef read_lines_from_file(file_name):chunksize = 10 ** 6record_map = {}# with pd.read_csv(file_name, chunksize=chunksize) as reader:for chunk in pd.read_csv(file_name, chunksize=chunksize):batch_list = chunk.values.tolist()for item in batch_list:record_map[item[0]] = item[1]print(file_name+str(len(record_map)))return record_mapdef get_difference(record_map_small, record_map_bigger):res = []for item in record_map_small.items():item_id = item[0]value_from_small = item[1]value_from_bigger = record_map_bigger.get(item_id, None)if value_from_bigger is not None and value_from_small != value_from_bigger:print (item_id, value_from_small, value_from_bigger)res.append((item_id, value_from_small, value_from_bigger))return resdef export_list_to_file(res, filename):with open(filename, 'w') as f:for item in res:f.write(str(item[0])+","+item[1]+","+item[2]+'\n')if __name__ == '__main__':# 需要比较的文件file_name = "/Users/.../test-app-deep.csv"record_map_small = read_lines_from_file(file_name=file_name)# 原文件file_name = "/Users/.../part-00000.csv"record_map_bigger =  read_lines_from_file(file_name=file_name)res = get_difference(record_map_small, record_map_bigger)# 把record_map_small里不同的内容输出到结果文件export_list_to_file(res, "/Users/..../test-app-dp-3.csv")

python csv文件比较相关推荐

  1. 9.5 Python csv 文件的写入操作

    9.5 Python csv 文件的写入操作 9.5.1 with open( ) as - with open() as ... 是对原有 open() 和 close() 的优化. 使用with ...

  2. 数据处理——-python csv文件删除行或者删除列

    python csv文件简单的删除行或者删除列主要有以下五种方法. ''' 方法一.二.三用于一般的删除 方法四使用切片比较方便 方法五一般用于遍历删除对应某种属性值的行 ''' import pan ...

  3. Python——CSV文件读写(CSV库)

    基本概念 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).纯文本意味着该文件是一个字 ...

  4. python csv文件参数化_Python 读取csv文件的某一列数据,并定义两个pattern,确定变化区间...

    Python 读取csv文件的某一列数据,并定义两个pattern,[-1, 1, 1] 和 [1, -1, -1]可以确定不同的变化区间 抓取股票数据,确定股票的变化区间. Date 3D10 20 ...

  5. python csv文件读取行列_使用Numpy读取CSV文件,并进行行列删除的操作方法

    Numpy是Python强大的数据计算和处理模块,其操作数据非常迅速且简单易行. 首先读取CSV文件 >>> import numpy as np#导入numpy模块 >> ...

  6. python csv文件复制时的编码问题_使用python读取CSV文件时的编码问题

    尝试使用python读取CSV文件时遇到障碍. 更新:如果只想跳过字符或错误,可以打开文件,如下所示: with open(os.path.join(directory, file), 'r', en ...

  7. python csv文件和xlsx文件混杂时,提取指定列数据并合并

    这篇文章是R语言 如何合并csv文件(批量读取csv文件)的姊妹篇.提供更为强大的功能. 解决的问题是提取csv文件和xlsx文件混杂时,文件合并问题.具体来说,下面的代码是提取指定列文本,简单清洗后 ...

  8. python csv文件转json

    CSV转json格式 直接上代码 import json fo=open("C:\\RenL\\entry.csv","r") #打开csv文件 ls=[] f ...

  9. 关于python csv文件操作,用wps打开乱码的问题

    用python写入csv文件制定编码的时候将 utf-8 改成 utf-8-sig 就可以解决csv文件被wps打开乱码的问题 fp =open('bsbdj.csv','w',newline='', ...

  10. python csv文件数据根据逗号分隔_Python 3读取以逗号分隔的CSV文件操作变量并写到CSV...

    我是Python的新手,并希望阅读下面列出的内容的CSV文件: DN, whenCreated, name, pwdLastSet, location "CN=Jackson2,OU=Dom ...

最新文章

  1. HDFS之SequenceFile和MapFile
  2. 听说,英特尔要对外开放 x86 授权?
  3. 日本漫画巨匠力作,看漫画就能学会Python,简直不要太轻松
  4. 合并两个无序数组java_Java实现十大排序算法(上)
  5. 数据库修改,删除的操作必须有保险操作。
  6. 检查本机显卡的cuda信息及适配cuda-sdk版本
  7. 11张图演进SeviceMesh服务网格
  8. 第2章 数据认知与预处理
  9. PAT1103 Integer Factorization (30)(DFS:回溯)
  10. 如何在网页中每小时更新一次数据?
  11. 大数据分析平台架构有哪些
  12. 智能实验室-杀马(Defendio) 4.11.0.790
  13. Python 水仙花数
  14. 构建一套完整高效的供应链系统体系
  15. 怎样卸载deepin系统_win10系统双系统下卸载deepin的详细技巧
  16. python从入门到精通-张子夜-专题视频课程
  17. 实时竞价的技术及行业展望
  18. 精挑细选的原创公众号,你值得拥有
  19. MySql学习【一】mysql的安装,操作数据库/表/查询表中数据/mysql日期计算
  20. 《缠中说禅108课》85:逗庄家玩的一些杂史 3

热门文章

  1. 融云发送图片消息_融云 SDK 消息结构详解
  2. 搅拌反应釜cad图纸_求夹套反应釜设计CAD图纸
  3. Excel:VBA编程入门(一)
  4. 新手教程:采用AD9软件画原理图
  5. 计算机命令关闭445端口,怎么关闭445端口-关闭windows端口的批处理命令
  6. C++自编图书借阅系统
  7. mysql的语句大全_mysql语句大全
  8. Java中文乱码问题如何解决?
  9. 【2020年“科创中国”】先导技术榜单、新锐企业榜单、产学研融通组织榜单发
  10. Hough变换——检测直线