• 对 DataFrame 对象迭代得到的是其各个属性列的列名,自然为 list 类型;

0. read_csv 与 df.to_csv

  • df.to_csv

    • na_rep=‘NA’:缺失值替换为NA
    • header=1/0:是否保存表头;
    • index=1/0:是否保存行的索引;

1. 从文件读取数据返回 data frame

<a href=“https://www.cnblogs.com/datablog/p/6127000.html”, target="_blank">pandas.read_csv参数详解

  • read_csvread_excel

    df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/'                 'breast-cancer-wisconsin/wdbc.data', header=None)      # df: data frame      # type(df): <class 'pandas.core.frame.DataFrame'>
    • 1
    • 2
    • 3
    • 4
  • header:表头,默认不为空(为 0,也即将第一行视为表头)。如果我们要读取的文件,直接就是数据,没有所谓的表头。就需指定 header=None,否则将以文件的第一行作为 df.columns。指定 header=None,df.columns 返回的是列索引,如一个三列的数据:

    Int64Index([0, 1, 2], dtype='int64')
    • 1
  • index_col:认定原始 csv 文件的第几列(从0开始计数)为索引列(也即从1开始编号,表示每一行样本的编号)

    • 一般会指定 index_col=0,表示第0列为索引列
    • index_col 指定的列将不会作为 DataFrame 的一列进行返回;
  • parse_datas:指明日期列,为字符串构成的 list;

  • thousands : str, default None,千分位分割符,如“,”或者“."

2. pandas 基本数据结构:Series 与 DataFrame

from pandas import Series, DataFrame

  • Series 最重要的一个功能在于:它在算术运算中会自动对齐不同索引的数据;
X, y = df.values[:, 2:], df.values[:, 1]    # df.values 的类型为 numpy.ndarray# 也可以X, y = df.loc[:, 2:].values, df.loc[:, 1].values
  • 1
  • 2
  • 3
  • 4

3. dataframe 与 numpy 下的多维数组的转换

dataframe ⇒ numpy.ndarray

  • df.ax_matrix()
  • df.values

4. 基本成员函数

  • df.dtypes:会按列给出各个列的数据类型;

  • df.columns,获取列名,可直接通过.的形式进行索引

    比如一个 df.columns 的返回值为:

    Index([u'dt', u'kind', u'value'], dtype='object')
    • 1

    可直接索引的含义在于,使用 df.dt 或者 df.kind 或者 df.value 进行索引,获取某列的全部值( 注,pandas 的特点,以列进行索引和修改)。同时索引多个列以构成一个新的表格,

    df[['dt', 'value']]            # 这样得到的仍然是 dataframe
    • 1

    支持[]的索引方式,但关键字必须是 list 的形式(['dt', 'value']),而不可以是 tuple

  • df.assign():指定新的列(如果列名已存在,则替换;如果不存在,在添加该列),返回一个新的 DataFrame,不对原始的 DataFrame 进行修改;

    • 当然其也可以接收一个 lambda 型的函数对象,该函数对象接收的参数则是原始的 dataframe;
    # 接收 lambda 型函数对象,>> df = DataFrame({'A':range(1, 6), 'B':np.random.randn(5)})>> df.assign(ln_A=lambda x: np.log(x.A))    A         B      ln_A0   1  0.456539  0.0000001   2  1.022736  0.6931472   3 -0.158207  1.0986123   4  0.951304  1.3862944   5 -1.024661  1.609438    # 此时 df 本身并未发生任何改变;>> df.assign(A = range(21, 26))    A         B0  21  0.4565391  22  1.0227362  23 -0.1582073  24  0.9513044  25 -1.024661
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    <a href=“http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.assign.html”, target="_blank">pandas.DataFrame.assign

  • set_index():将某列设置为索引列;

再分享一下我老师大神的人工智能教程吧。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow

pandas —— pd read csv 与df to csv相关推荐

  1. python导出csv有引号_python – csv中的双引号元素不能用pandas读取

    我有一个输入文件,其中每个值都存储为一个字符串. 它位于一个csv文件中,每个条目都在双引号内. 示例文件: "column1","column2", &quo ...

  2. Pandas如何读取和导出 Excel、CSV、JSON 数据?

    转载自:Pandas如何读取和导出 Excel.CSV.JSON 数据? - 知乎 导入pandas等包 import pandas as pd import numpy as np import m ...

  3. csv java web 导入_DAY5-step9 使用CSV模块和Pandas在Python中读取和写入CSV文件

    什么是CSV文件? CSV文件是一种纯文本文件,其使用特定的结构来排列表格数据. CSV是一种紧凑,简单且通用的数据交换通用格式. 许多在线服务允许其用户将网站中的表格数据导出到CSV文件中. CSV ...

  4. 用python的pandas打开csv文件_使用CSV模块和Pandas在Python中读取和写入CSV文件

    什么是CSV文件? CSV文件是一种纯文本文件,其使用特定的结构来排列表格数据.CSV是一种紧凑,简单且通用的数据交换通用格式.许多在线服务允许其用户将网站中的表格数据导出到CSV文件中.CSV文件将 ...

  5. [转载] pythonpandas读取csv文件最后一行_简单小案例(一):使用Pandas在Python中读取和写入CSV文件...

    参考链接: 使用Pandas在Python中读写CSV文件 前期文章链接: YOLOv3论文 https://arxiv.org/pdf/1804.02767.pdf 正文: 有许多方法可以在Pyth ...

  6. np读取csv文件_pythonpandas读写csv数据

    官方介绍:pandas的官方手册:https://pandas.pydata.org/pandas-docs/stable/pandas官方读写数据文档:https://pandas.pydata.o ...

  7. python3.7读取csv文件_Python3 读取csv文件

    使用pandas 读取csv文件前几行数据 文件内容如下: 先读取标题: importpandas as pd path= r'C:\Users\dhw\Desktop\work\term paper ...

  8. 【pandas】查找重复数据 df.duplicated() 、删除重复数据 df.drop_duplicates()

    数据准备 import pandas as pdtrain = pd.read_csv(r"../input/titanic/train.csv") train.head() 查看 ...

  9. 将多个csv文件合成一个csv

    1.python的writer做法 import csv import pandas as pd import os from statistics import mean #对dev测试生成的多个c ...

最新文章

  1. 声场噪音测试软件,粉红噪声:测试声场频率的标准信号源(转载)
  2. Spring框架(1)
  3. javaweb开发之处理表单上传文件和文件下载
  4. WordPress简约博客主题模板Chen主题V1.2
  5. win10专业版系统没有休眠选项如何解决?
  6. pandas: pd.concat([df1,df3],axis默认=0纵向拼接),concat常用于纵向拼接,默认outer join
  7. 鸿蒙HMS大势渐成,P40系列开启华为终端新征程
  8. 鲁棒控制器设计方法(systune,hinfsyn,musyn...)
  9. html5的canvas绘制迷宫地图
  10. PAT 乙级 1020  月饼
  11. 机载激光雷达测量技术理论与方法读书笔记(3)机载激光雷达测量数据的滤波分类
  12. VMware Linux虚拟机CPU占用过高
  13. UVA 10881 Piotr‘s Ants
  14. 支付宝钱包系统架构内部剖析
  15. python:numpy从数组中随机抽取元素
  16. 寻找假币问题(二分法)
  17. 羊皮卷的故事-第十五章-羊皮卷之八
  18. 怎么禁止WordPress后台加载谷歌字体?
  19. 极限切割异形图形描述脚本语言:Q代码指南
  20. 举例5种计算机网络设备,一种计算机网络设备的制作方法

热门文章

  1. 国际统计年鉴(1995-2022)
  2. 基于OpenJWeb开发的汽车配件网上商城
  3. 跑步机冬天踏的时候发出吱吱的声音,过一会就没有了
  4. Linux 文件/目录管理命令汇总
  5. 物联网时代下的共享单车
  6. 整合JDBC的使用连接数据库
  7. Java实现快速文件查重功能
  8. python语句print type 1234的结果是_python语句print(type(123))的数据结果是( )。_学小易找答案...
  9. jquery判断滚动条是否到底
  10. 前端常见的8种设计模式