这个东西的好处是你可以把输出的pickle文件作为数据源,而且不会占用disk的空间

####################################下面是官方教程(注意已经过时)##################################

下面是原文转载:

Our data science and engineering teams have some big news to share… you can now use any public kernel’s output files as a data source!

Plug and Play

This new functionality enables code that is more flexible, reusable, and easier to troubleshoot. With kernels as data sources, you can neatly plug together a data polishing script in R, a visualization script, and a model fitting script in Python without messy dependencies.

Follow Along

Cleaner and more compartmentalized code makes kernels an even better learning resource. Now your code can follow better practices, making it easier for new data scientists to follow along and for collaborators to pull out the pieces that will help them iterate effectively.

Adding a Kernel Data Source

Only kernels with data files as output can be used as a data source.

There are two ways to add a kernel as a data source:

1.Click Add a Data Source from within a kernel you are editing.

You’ll see that Kernels is now listed alongside Datasets and Competitions in the pop up. You can search for specific kernels using the search box.

  1. Go to any usable kernel’s Output tab and click “New Kernel Using This Data”.

Aurelio, the lead engineer on this feature, would love to hear what you think!

#########################下面是自己的教程###################################

1.在一个名叫IEEE Simple XGBoost的Notebook中写一大堆代码(代码中必须包含to_pickle之类的输出函数),然后commit

2.重新打开

https://www.kaggle.com/appleyuchi/ieee-simple-xgboost/output

选择output一栏:

3.点击上面的Nwe Dataset,会弹出对话框

我们把新的数据集(同时也是一个文件夹)取名为useNewData,然后点击Create,会出现下面的进度条:

4.

5.然后点击New Notebook,此时就会新建New Notebook来使用自己刚刚生成的pickle数据.

6.等待一段时间后,我们会看到新生成NoteBook中的右侧是:

7.最后,当你重新打开kaggle的时候,就能看到这个:

上面的useNewData就是你新建的数据集的名字.

小结:

pickle数据的读取速度远远快于csv文件

Reference:

https://www.kaggle.com/product-feedback/45472

存储输出的pickle文件作为数据源相关推荐

  1. 手写字母数据集转换为.pickle文件

    首先是数据集,我上传了相关的资源,https://download.csdn.net/download/fanzonghao/10566701 转换代码如下: import numpy as np i ...

  2. 【java笔记】IO流(1):IO流概述,字节输出/输入流读写文件

    IO概述: I: input( 读取 ) 把硬盘中的数据,读取到内存中使用 O: output(写入)  把内存中的数据,写入到硬盘中保存 流:数据(字符,字节)1个字符=2个字节 ,1个字节=8个二 ...

  3. oracle 源代码输出,oracle-如何将DBMS_OUTPUT.PUT_LINE的输出重定向到文件?

    oracle-如何将DBMS_OUTPUT.PUT_LINE的输出重定向到文件? 我需要在pl / sql中进行调试以计算过程次数,我想使用: SELECT systimestamp FROM dua ...

  4. python3 logging输出到文件_python3:logging模块 输出日志到文件

    python自动化测试脚本运行后,想要将日志保存到某个特定文件,使用python的logging模块实现 参考代码: importloggingdefinitLogging(logFilename,e ...

  5. 如何把标签输出为PDF文件

    很多用户在使用条码软件制作标签文件时,大多数时候都会直接连接打印机将标签打印出来,但是有时候会需要将制作完成的标签输出为PDF文件.其实条码软件支持多种输出方式,比如位图.矢量图.PDF文件等.下面我 ...

  6. c语言 输出定向到文件 命令提示符窗口也能看见,关于cmd:显示Windows命令提示符输出并将其重定向到文件...

    如何在Windows命令提示符下运行命令行应用程序并同时显示输出并重定向到文件? 例如,如果我要运行命令dir > test.txt,则会将输出重定向到名为test.txt的文件而不显示结果. ...

  7. 模拟输入H.264流,输出封装格式文件(API版)

    每次从H.264文件读入一定数据量的数据,模拟输入H.264流,最终输出封装格式文件. //H264ToContainer_Win32.h extern "C" {//@param ...

  8. 利用FFmpeg将H.264文件读入内存,再输出封装格式文件

    /***先将H.264文件读入内存,*再输出封装格式文件.*/ #include "stdafx.h"#define __STDC_CONSTANT_MACROSextern &q ...

  9. 模拟输入H.264流,输出封装格式文件

    /***每次从H.264文件读取IO_BUFFER_SIZE字节的数据,*模拟输入H.264流,最终输出封装格式文件.*/ #include "stdafx.h"#define _ ...

最新文章

  1. 程序员:做测试开发每天忙于业务,看不到希望
  2. ZABBIX3.0配置邮件报警
  3. STM32:Flash擦除与读写操作(HAL库)
  4. log4j配置文件_Mybatis对log4j的支持及常用标签-Mybatis(6)
  5. POJ2527(两多项式取余)
  6. zookeeper清空hbase_HBase在zookeeper下不创建目录
  7. 「leetcode」93.复原IP地址【回溯算法】详解!
  8. Python:bs4的使用
  9. easyui模版html,EasyUI 模板(Template)_Vue EasyUI Demo
  10. 攻防世界——MISC——pdf
  11. call function中的 exporting/importing/changing
  12. 用火箭送快递?淘宝宣布联合蓝箭航天起启动“宝箭”计划
  13. linux进化树分析的软件,一款好用的进化树可视化编辑软件
  14. Skyscrapers (hard version)
  15. 陈耀烨九段加冕新名人见证实录
  16. [Matlab]Simulink绘制3维图像
  17. 数通运营商方向常见面试问题(第五部分)
  18. 关于DMA,TCM(ITCM和DTCM)和Cache
  19. 刨根问底 HTTP 和 WebSocket 协议(上)
  20. 使用initial-letter实现首字下沉效果,感兴趣的同学欢迎猛击:

热门文章

  1. Ubuntu 14.04 安装Visual studio Code
  2. 郝斌--数据结构---汉诺塔实现(c语言实现)
  3. 一步一步教你抓数据——用.net精确提取网站数据的通用方法 [转]
  4. 基于约束的SQL攻击
  5. (十五)算法设计思想之“回溯算法”
  6. mysql 自动热备份_mysql(mariadb)定时自动热备份+增量+远程备份脚本
  7. php 生成wsdl工具,php中使用zendstudio 12为soapserver生成wsdl文件
  8. mysql 备份库的shell_shell学习之自动备份mysql数据库
  9. react复制内容到剪贴板
  10. bat文件先杀掉端口号,然后启动jar包