• 对 DataFrame 对象迭代得到的是其各个属性列的列名,自然为 list 类型;

0. read_csv 与 df.to_csv

  • df.to_csv

    • na_rep=‘NA’:缺失值替换为NA
    • header=1/0:是否保存表头;
    • index=1/0:是否保存行的索引;

1. 从文件读取数据返回 data frame

<a href=“https://www.cnblogs.com/datablog/p/6127000.html”, target="_blank">pandas.read_csv参数详解

  • read_csvread_excel

    df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/''breast-cancer-wisconsin/wdbc.data', header=None)# df: data frame# type(df): <class 'pandas.core.frame.DataFrame'>
    
  • header:表头,默认不为空(为 0,也即将第一行视为表头)。如果我们要读取的文件,直接就是数据,没有所谓的表头。就需指定 header=None,否则将以文件的第一行作为 df.columns。指定 header=None,df.columns 返回的是列索引,如一个三列的数据:

    Int64Index([0, 1, 2], dtype='int64')
    
  • index_col:认定原始 csv 文件的第几列(从0开始计数)为索引列(也即从1开始编号,表示每一行样本的编号)

    • 一般会指定 index_col=0,表示第0列为索引列
    • index_col 指定的列将不会作为 DataFrame 的一列进行返回;
  • parse_datas:指明日期列,为字符串构成的 list;

  • thousands : str, default None,千分位分割符,如“,”或者“."

2. pandas 基本数据结构:Series 与 DataFrame

from pandas import Series, DataFrame

  • Series 最重要的一个功能在于:它在算术运算中会自动对齐不同索引的数据;
X, y = df.values[:, 2:], df.values[:, 1]# df.values 的类型为 numpy.ndarray
# 也可以
X, y = df.loc[:, 2:].values, df.loc[:, 1].values

3. dataframe 与 numpy 下的多维数组的转换

dataframe ⇒ numpy.ndarray

  • df.ax_matrix()
  • df.values

4. 基本成员函数

  • df.dtypes:会按列给出各个列的数据类型;

  • df.columns,获取列名,可直接通过.的形式进行索引

    比如一个 df.columns 的返回值为:

    Index([u'dt', u'kind', u'value'], dtype='object')
    

    可直接索引的含义在于,使用 df.dt 或者 df.kind 或者 df.value 进行索引,获取某列的全部值( 注,pandas 的特点,以列进行索引和修改)。同时索引多个列以构成一个新的表格,

    df[['dt', 'value']]            # 这样得到的仍然是 dataframe
    

    支持[]的索引方式,但关键字必须是 list 的形式(['dt', 'value']),而不可以是 tuple

  • df.assign():指定新的列(如果列名已存在,则替换;如果不存在,在添加该列),返回一个新的 DataFrame,不对原始的 DataFrame 进行修改;

    • 当然其也可以接收一个 lambda 型的函数对象,该函数对象接收的参数则是原始的 dataframe;
    # 接收 lambda 型函数对象,
    >> df = DataFrame({'A':range(1, 6), 'B':np.random.randn(5)})
    >> df.assign(ln_A=lambda x: np.log(x.A))A         B      ln_A
    0   1  0.456539  0.000000
    1   2  1.022736  0.693147
    2   3 -0.158207  1.098612
    3   4  0.951304  1.386294
    4   5 -1.024661  1.609438# 此时 df 本身并未发生任何改变;
    >> df.assign(A = range(21, 26))A         B
    0  21  0.456539
    1  22  1.022736
    2  23 -0.158207
    3  24  0.951304
    4  25 -1.024661
    

    <a href=“http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.assign.html”, target="_blank">pandas.DataFrame.assign

  • set_index():将某列设置为索引列;

pandas —— pd.read_csv 与df.to_csv相关推荐

  1. pandas —— pd read csv 与df to csv

    对 DataFrame 对象迭代得到的是其各个属性列的列名,自然为 list 类型: 0. read_csv 与 df.to_csv df.to_csv na_rep='NA':缺失值替换为NA he ...

  2. pandas系列 read_csv 与 to_csv 方法各参数详解(全,中文版)

    * 由于在做数据处理,数据分析的时候,免不了读取数据或者将数据转换为相应的处理形式,那么,pandas的read_csv和to_csv,就能给我们很大的帮助,接下来,博主,将 read_csv 和 t ...

  3. pandas使用read_csv读取数据使用skiprows参数跳过指定的数据行但保留表头、pandas使用to_csv函数将dataframe保存为gzip压缩文件

    pandas使用read_csv读取数据使用skiprows参数跳过指定的数据行但保留表头.pandas使用to_csv函数将dataframe保存为gzip压缩文件 目录

  4. 例子解释,pandas的pd.read_csv函数,quoting = 3是什么意思

    问题 pandas的pd.read_csv函数,quoting = 3是什么意思? 新建一个test.txt文件,内容如下: 哈哈 haha "haha" "哈哈&quo ...

  5. 关于pd.read_csv() 读数据的注意事项

    关于pd.read_csv() 读数据的注意事项 实验数据:adult.data 编译环境:pycharm 代码编写:Sublime Text3 ① import pandas as pd#加载数据 ...

  6. pd.read_csv读取txt时整型变成浮点型问题解决

    https://zhuanlan.zhihu.com/p/27440031 pandas中读取csv文件通常使用pd.read_csv()函数,正常情况下给出文件路径即可读取数据,不过在某些特殊情况下 ...

  7. pandas中read_csv的缺失值处理方式

    今天遇到的问题是,要将一份csv数据读入dataframe,但某些列中含有NA值.对于这些列来说,NA应该作为一个有意义的level,而不是缺失值,但read_csv函数会自动将类似的缺失值理解为缺失 ...

  8. python:pandas之read_csv

    导入必要的包 import pandas as pd import numpy as np from pandas.api.types import CategoricalDtype from io ...

  9. 数据分析与预测(二)——pandas 函数read_csv解析

    ​ 一. 前言 使用pandas做数据处理的第一步就是读取数据,数据源可以来自于各种地方,csv文件便是其中之一.而读取csv文件,pandas也提供了非常强力的支持,参数有四五十个.这些参数中,有的 ...

最新文章

  1. CoolPad backdoor CoolReaper
  2. 转:20分钟教你使用hexo搭建github博客
  3. 结合swiper使用图片懒加载
  4. Spring Data JPA简单学习
  5. 史上最难吃系列,肯德基就不能好好做鸡吗?
  6. python交互式怎么保存_如何保存Python交互式会话?
  7. Bugku-Web-速度要快-WriteUp
  8. [SAP ABAP开发技术总结]以二进制、字符模式下载文件
  9. ssm框架返回html,ssm框架controller层返回json格式数据到页面
  10. Xcode - Plugins And Themes
  11. eclipse汉化包
  12. c语言程序 随机抽取试卷,试题自动提取系统的设计与实现
  13. 宽度学习(Broad Learning System)
  14. 通过doi可以检索到文献_什么是DOI?如何获取文献的DOI?
  15. pytorch求STFT
  16. UML培训取得姣好成绩,受到客户好评
  17. Java mybatis-plus详解
  18. Java程序员月薪达到三万,需要技术水平达到什么程度?(转)
  19. java的正确学习姿势
  20. 【机器学习】鸢尾花分类问题

热门文章

  1. queue初始化java,如何在java中实例化一个Queue对象?
  2. request中的技巧
  3. spring的部分注释
  4. mysql锁的应用场景_浅谈Mysql共享锁、排他锁、悲观锁、乐观锁及其使用场景
  5. Linux环境SOCKET编程3:压力测试
  6. cvAdaptiveThreshold源代码的解析
  7. [NOI2019]序列
  8. java以正确的方式停止线程
  9. 在Linux 安装Python3.5.6详细文档!!!!
  10. vim 基础命令大全