Instance Tunnel 使用

1. 执行一条 select 查询:

odps@ odps_test_project>select * from wc_in;
ID = 20170724071705393ge3csfb8

2.使用 Instance Tunnel Download 命令下载执行结果到本地文件

odps@ odps_test_project> tunnel download -h true -cf true instance://huorong_bigdata/20220329031048178gumx85t32 C:\Users\HR\Desktop\weekReport\工作日周三.csv;\2017-07-24 15:18:47  -  new session: 2017072415184785b6516400090ca8    total lines: 8
2017-07-24 15:18:47  -  file [0]: [0, 8), result
downloading 8 records into 1 file
2017-07-24 15:18:47  -  file [0] start
2017-07-24 15:18:48  -  file [0] OK. total: 44 bytes
download OK// 查看结果cat result
slkdfj
hellp
apple
tea
peach
apple
tea
teaa

参数说明

命令:
tunnel download instance://<[project_name/]instance_id> <path>

注意

odps默认设置了以下参数
instance_tunnel_max_record=10000
下载行数受限制在1w行以内,大表的话去odps_config.ini文件里把它注掉,下载就不会有行数限制了
参数说明
必选参数
path
下载数据文件的路径以及名称。数据文件的归档路径有两种选择:您可以将文件直接归档至MaxCompute客户端的bin目录中,此时path需要设置为文件名.后缀名;也可以将文件归档至其他路径下,例如D盘的test文件夹,path需要设置为D:\test\文件名.后缀名。[project.]table[/partition]
目标表表名。如果是分区表,需要指定至最末级分区。如果不是当前空间的表,需要指定表所在的空间名。可选参数
-acp
如果指定分区不存在,自动创建目标分区。默认值为False。-bs
指定每次上传至Tunnel的数据块大小。默认值为100 MiB(1 MiB=1024×1024 Byte)。-c 【UTF-8 、GBK】
指定本地数据文件编码。默认不设定,下载源数据。-cf
指定是否为CSV文件,默认值为False。说明 Upload仅支持TXT、CSV格式文件,默认上传TXT文件。如果上传CSV文件,需要指定-cf参数,同时请下载最新版本的MaxCompute客户端。
-cp
指定是否在本地压缩数据后再上传,减少网络流量。默认值为True。-dbr
指定是否忽略脏数据(多列、少列、列数据类型不匹配等情况)。默认值为False。True:忽略全部不符合表定义的数据。
False:如果遇到脏数据,则给出错误提示信息,目标表内的原始数据不会被污染。
-dfp
指定DATETIME类型数据格式,默认为yyyy-MM-dd HH:mm:ss。如果您想指定时间格式到毫秒级别,可以使用tunnel upload -dfp 'yyyy-MM-dd HH:mm:ss.SSS'。DATETIME数据类型详情请参见数据类型版本说明。-fd
指定本地数据文件的列分割符。默认值为英文逗号(,)。-h
指定数据文件是否包括表头。默认值为False。如果为True,则dship会跳过表头从第二行开始上传数据。-mbr
指定可容忍的脏数据量。超过此数据量时,终止上传。默认值为1000条。-ni
指定NULL数据标识符。默认值为空字符串。-ow
指定上传数据是否覆盖表或分区。默认值为False,上传数据为累加方式。示例如下。
tunnel upload -overwrite true log.txt test_project.test_table/p1="b1",p2="b2";
-rd
指定本地数据文件的行分割符。默认值为\r\n。-s
指定是否扫描本地数据文件。默认值为True。
True:先扫描数据,若数据格式正确,再导入数据。
False:不扫描数据,直接导入数据。
Only:仅扫描本地数据,扫描结束后不继续导入数据。
-sd
指定Session目录。-ss
指定严格架构模式。默认值为True。如果为False,多余的数据将被丢弃,不足的字段将填充NULL。-t
指定Threads的数量。默认值为1。-te
指定Tunnel的Endpoint。-time
指定是否跟踪上传所用时间。默认值为False。-tz
指定时区。默认值为本地时区,例如Asia/Shanghai。

Instance Tunnel 使用相关推荐

  1. 阿里云MaxCompute中pyODPS的使用:多线程上传、下载、分区

    文章目录 1 初始化入口 2 java可实现:SQLTask配合Tunnel实现大量数据导出 3 pyODPS 3.1 sql读入 3.2 DataFrame 3.2.1 dataframe读入 3. ...

  2. MaxCompute客户端(odpscmd)

    MaxCompute客户端(odpscmd) 您可以通过MaxCompute客户端访问MaxCompute项目并运行命令. 前提条件 在使用MaxCompute客户端前,请您确认已满足如下条件: 待安 ...

  3. SQL_ODPS-MaxCompute-odpscmd-1.0

    dSQL_ODPS-MaxCompute-odpscmd-1.0 注:这篇每块代码按顺序操作 每块可按顺序看 目的:熟悉一下日志 (一)简单的语句操作 普通表 --复制表结构 odps@ work_t ...

  4. MaxCompute导入数据

    使用tunnel命令导入数据的官方文档:https://help.aliyun.com/document_detail/27809.html?spm=a2c4g.11186623.6.590.709b ...

  5. 阿里巴巴大数据计算平台MaxCompute(原名ODPS)全套攻略(持续更新20171127)

    概况介绍 大数据计算服务(MaxCompute,原名ODPS,产品地址:https://www.aliyun.com/product/odps)是一种快速.完全托管的TB/PB级数据仓库解决方案.Ma ...

  6. Hibernate中文参考文档(JFIS)

    HIBERNATE - 符合Java习惯的关系数据库持久化      下一页 HIBERNATE - 符合Java习惯的关系数据库持久化 Hibernate参考文档 3.0.4 目录 前言 1. 翻译 ...

  7. MaxCompute Tunnel上传典型问题场景

    数据问题 Q:使用Tunnel Java SDK上传数据,上传数据可以自动分配到各个分区吗? A:目前Tunnel是无法自动上传数据并自动分配到各个分区的:每一次上传只支持数据上传到一张表或表的一个分 ...

  8. MaxCompute Tunnel命令

    Tunnel命令 背景 DataWorks Web端查询界面返回数据结果最大限制为10000条,因此无法在DataWorks界面导出超过MaxCompute SQL查询结果限制的数据. MaxComp ...

  9. Workbench Could not connect the SSH Tunnel Authentication error

    1. 问题现象 平日正常使用的 Workbench 在重启电脑之后发现无法连接到对应的数据库,workbench log显示 SSH tunnel]: Authentication error ope ...

最新文章

  1. 【[AHOI2013]差异】
  2. CString 操作函数
  3. airplay2协议是什么_什么是AirPlay?
  4. matlab 高级函数
  5. 10 倍高清不花!大麦端选座 SVG 渲染
  6. JDBC.property 配置文件中链接数据库的配置
  7. 人脸方向学习(十一):Face Landmark Detection-PFLD解读
  8. 得力人脸识别考勤机密码设置_得力人脸识别考勤机使用与上传数据方法哪位清楚?...
  9. 考个ISTQB证书有用吗
  10. Affinity Photo2022比PS更好用的图像编辑软件
  11. 100层楼扔鸡蛋,最快速度找出,哪层是鸡蛋碎的临界点
  12. 硬件学习笔记(器件篇)—— 电感(二)
  13. 基于三维地图的可视化工厂优势
  14. python中的init_python中init什么意思
  15. 测试服务器运行温度,负载、功耗、温度测试结果
  16. csgo 放置机器人_csgo怎么在确定位置放置一个bot?
  17. microscan说明书_MicroScan WA96微生物分析仪使用评价
  18. LED和LCD,LED和OLED,AMOLED和OLED有什么区别
  19. bzoj4521【CQOI2016】手机号码
  20. oracle 01031 dblink,通过修改基表(link$)让非public dblink变为public

热门文章

  1. Glide的使用回收内存问题
  2. R语言命令行写linux,如何在Linux上编写和使用R脚本
  3. 51单片机中断的调用寄存器组(PSW)的作用,以及汇编堆栈的作用,堆栈指针的SP的使用方法,RAM的运行和ROM在单片机具体运行和C语言的优势和中断,定时器基础知识(上)
  4. 解决多线程安全问题的几种方式?
  5. ZLiTE Lightweight Clients for Shielded Zcash Transactions using Trusted Execution
  6. 进制转换 2进制转10进制 10进制转2进制
  7. 正弦信号发生器(A题)
  8. python gil锁为什么_day9-为什么会有GIL锁 (来自师兄总结的博客)
  9. 纵断面 java_道路土方计算软件
  10. Java虚拟机讲解 与 搞垮Java虚拟机