天池实验室|读取数据集的两种方式
- 读取挂载数据中的数据集
具体代码如下:
# 步骤1:
!ls datalab/# 步骤2:
import os
os.chdir('/home/tianchi/datalab/75057')
print(os.getcwd())# 步骤3:
import pandas as pd
import os
# 挂载数据中的数据集读取
os.chdir('/mnt/file/opensearch/documents/75057')
df=pd.read_excel('dataset-1.xlsx',sheet_name='Sheet1')
#获取最大行,最大列
nrows=df.shape[0]
ncols=df.columns.size
print('Max Rows:'+str(nrows))
print('Max Columns'+str(ncols))
核心是路径的写法:这里挂载数据不能直接找到文件名,需要去找到文件夹,才能找到具体数据集文件,所有实验室的数据访问都在/home/tianchi/tianchilab路径下
- 读取个人空间中的数据集
前提:在个人空间中新建文件夹:dataset,在该文件夹下上传数据集文件,名称为:dataset-1.xlsx
具体代码:
import pandas as pd
# 个人空间中的数据集读取
sExcelFile='/home/tianchi/myspace/dataset/dataset-1.xlsx'
df = pd.read_excel(sExcelFile,sheet_name='Sheet1')
#获取最大行,最大列
nrows=df.shape[0]
ncols=df.columns.size
print('Max Rows:'+str(nrows))
print('Max Columns'+str(ncols))
核心是路径的写法:/home/tianchi/myspace/dataset/dataset-1.xlsx,个人空间的数据都在/home/tianchi/myspace路径下
天池实验室|读取数据集的两种方式相关推荐
- spark消费kafka产生数据堆积怎么处理_SparkStreaming读取Kafka的两种方式
本文主要从以下几个方面介绍SparkStreaming读取Kafka的两种方式: 一.SparkStreaming简介 二.Kafka简介 三.Redis简介(可用于保存历史数据或偏移量数据) 四.S ...
- sparkstreaming 读取mysql_SparkStreaming读取Kafka的两种方式
本文主要从以下几个方面介绍SparkStreaming读取Kafka的两种方式: 一.SparkStreaming简介 二.Kafka简介 三.Redis简介(可用于保存历史数据或偏移量数据) 四.S ...
- nodejs 逐行读取文件的两种方式
nodejs 逐行读取文件的两种方式 通过readline的方式 const fs = require('fs'); const readline = require('readline');let ...
- Java读取证书的两种方式
关于证书基础以及创建.查看.删除.导入.导出以及其他功能详解请参照:Java使用keytool创建CA证书 Java读取证书有两种方式 1.从文件中读取 public static void main ...
- Delphi 读取文本文件的两种方式
用两种方式读取文本文件:文件流读取和文件变量读取 一.文件流方式 {*******************************************************} {功能:读取文本文 ...
- 关于spring读取配置文件的两种方式
很多时候我们把需要随时调整的参数需要放在配置文件中单独进行读取,这就是软编码,相对于硬编码,软编码可以避免频繁修改类文件,频繁编译,必要时只需要用文本编辑器打开配置文件更改参数就行.但没有使用框架之前 ...
- 一行一行读取文件的两种方式
1)方式1 static void Main(string[] args){ using (StreamReader reader = new StreamReader("1.txt&quo ...
- Java代码读取图片的两种方式
不废话在,直接上代码: 方式一: 适用场景: 图片size小 方式二: 适用场景: 图片size大 细节点: java 代码读取图片的方式,从这点入手: 关注我的博客
- stm32读取编码器的两种方式
1.使用外部中断 读取 #include "spin.h"#define encoder_port GPIOG #define encoder_pin (GPIO_Pin_3|GP ...
最新文章
- 我对变量产生了这些想法
- github 慢_告别github 下载慢问题,让你的github下载速度起飞
- 当session会话结束时,重定向到登录页显示在iframe框内的问题
- 如何为Kafka挑选合适的分区数
- Java讲课笔记24:字节流
- 移卡科技java_聊一聊Java垃圾回收与卡表技术
- 我的小纠结,技术与认知哪个更重要?
- redis源码解析之事件驱动
- java 父子级json组装不用递归_揭秘java中无数人伤透脑筋最为神秘的技术之一——ClassLoader...
- 搭建php实验报告_php实验报告..doc
- 反转链表-递归反转法
- C#录制声卡声音喇叭声音音箱声音
- 语法长难句之从句——名词性从句
- 草图大师怎么取消组件关联_sketchup取消隐藏(草图大师里取消全部隐藏快捷键)...
- 3dmax文件保存后超大怎么缩小?想学3D建模,还没软件速来领取
- 最好看的Excel条形图 如何用Excel图表把它做出来
- 教学方法(学科教学法)
- python查看迭代器可迭代次数
- 基于leftlet的旅游地图相册
- filepath直接指定到文件名吗_快速实现对文件按时间的重命名
热门文章
- 那些我希望在一开始使用 Zsh(oh-my-zsh) 时就知道的
- UVa11882,Biggest Number
- v-charts显示标题
- 修改选择文件按钮,变成自己设置的样式
- [linux][MongoDB] mongodb学习(一):MongoDB安装、管理工具、
- css3实现超出文本指定行数(指定文本长度)用省略号代替
- 在 CentOS7 上安装 MySQL5.7
- 安装完成后在命令行运行bash时报错0x80070057
- AIX系统相关的日常操作
- POJ 3080 Blue Jeans (多个字符串的最长公共序列,暴力比较)