TiDB Lightning 是用于从静态文件导入 TB 级数据到 TiDB 集群的工具,常用于 TiDB 集群的初始化数据导入。

要快速了解 Lightning 的基本原理和使用方法,建议先观看下面的培训视频(时长 32 分钟)。注意本视频只为学习参考,具体操作步骤和最新功能,请以文档内容为准。

TiDB Lightning 支持以下文件类型:

  • Dumpling 生成的文件
  • CSV 文件
  • Amazon Aurora 生成的 Apache Parquet 文件

TiDB Lightning 支持从以下位置读取:

  • 本地
  • Amazon S3
  • Google GCS

TiDB Lightning 整体架构

TiDB Lightning 目前支持两种导入方式,通过backend配置区分。不同的模式决定 TiDB Lightning 如何将数据导入到目标 TiDB 集群。

  • Physical Import Mode:TiDB Lightning 首先将数据编码成键值对并排序存储在本地临时目录,然后将这些键值对上传到各个 TiKV 节点,最后调用 TiKV Ingest 接口将数据插入到 TiKV 的 RocksDB 中。如果用于初始化导入,请优先考虑使用 Physical Import Mode,其拥有较高的导入速度。

  • Logical Import Mode:TiDB Lightning 先将数据编码成 SQL,然后直接运行这些 SQL 语句进行数据导入。如果需要导入的集群为生产环境线上集群,或需要导入的目标表中已包含有数据,则应使用 Logical Import Mode。

导入模式 Physical Import Mode Logical Import Mode
速度 快 (100 ~ 500 GiB/小时) 慢 (10 ~ 50 GiB/小时)
资源使用率
占用网络带宽
导入时是否满足 ACID
目标表 必须为空 可以不为空
支持 TiDB 集群版本 >= v4.0.0 全部
导入期间是否允许 TiDB 对外提供服务

注意

以上性能数据用于对比两种模式的导入性能差异,实际导入速度受硬件配置、表结构、索引数量等多方面因素影响。

TiDB Lightning 简介相关推荐

  1. 探索TiDB Lightning源码来解决发现的bug

    背景 上一篇<记一次简单的Oracle离线数据迁移至TiDB过程>说到在使用Lightning导入csv文件到TiDB的时候发现了一个bug,是这样一个过程. Oracle源库中表名都是大 ...

  2. TiDB Lightning 故障处理

    本文档总结了使用 TiDB Lightning 过程中常见的运行故障及解决方案. TiDB Lightning 导入速度太慢 TiDB Lightning 的正常速度为每条线程每 2 分钟导入一个 2 ...

  3. TiDB Lightning 常见问题

    本文列出了一些使用 TiDB Lightning 时可能会遇到的问题与答案. TiDB Lightning 对 TiDB/TiKV/PD 的最低版本要求是多少? TiDB Lightning 的版本应 ...

  4. 部署 TiDB Lightning

    本文主要介绍 TiDB Lightning 进行数据导入的硬件需求,以及手动部署 TiDB Lightning 的方式.Lightning 不同的导入模式,其硬件要求有所不同,请先阅读: Physic ...

  5. TiDB Lightning 数据源

    TiDB Lightning 支持从多种类型的文件导入数据到 TiDB 集群.通过以下配置为 TiDB Lightning 指定数据文件所在位置. [mydumper] # 本地源数据目录或 S3 等 ...

  6. TiDB Lightning 快速上手

    本教程假设使用的是若干新的.纯净版 CentOS 7 实例,你可以(使用 VMware.VirtualBox 及其他工具)在本地虚拟化或在供应商提供的平台上部署一台小型的云虚拟主机.因为 TiDB L ...

  7. TiDB备份与恢复简介

    本文档介绍如何对 Kubernetes 上的 TiDB 集群进行数据备份和数据恢复.备份与恢复中所使用的工具有 Dumpling.TiDB Lightning 和 BR. Dumpling 是一个数据 ...

  8. TiDB Lightning 断点续传

    大量的数据导入一般耗时数小时至数天,长时间运行的进程会有一定机率发生非正常中断.如果每次重启都从头开始,就会浪费掉之前已成功导入的数据.为此,TiDB Lightning 提供了"断点续传& ...

  9. TiDB Cloud简介

    目录 多租户 TiDB Cloud TiDB Cloud入门 Developer Tier Dedicated Tier TiDB Cloud实现示例 其他TiDB Cloud端门户 摘要:云与本地部 ...

最新文章

  1. 史上最强最贵Mac Pro诞生,iPadOS和iOS分家!WWDC19全面总结
  2. 英伟达CUDA太难!OpenAI出手要取代它,新语言性能相当但编程更简单
  3. Asp.net SignalR快速入门 ---- /signalr/hubs 404
  4. f1 score与f2 score的区别
  5. Java之品优购课程讲义_day19(6)
  6. leetcode94. 二叉树的中序遍历(左中右)
  7. Oracle ADF和Oracle Jet一起工作。 建筑模式
  8. mysql导出表_mysql导出表的3种方式
  9. 系统辨识理论及应用_液压系统故障智能诊断方法(2)
  10. c当中extern详解
  11. c语言数字和字母运算,计算器中的字母CE、C、MR、MC、MS、M+、M-等等各是什么意思?让我来告诉你吧!...
  12. Delphi著名皮肤控件库大全
  13. 思科 计算机网络 第5章测试考试 答案
  14. adb关闭系统自动更新
  15. 教你如何安慰失戀人?
  16. matlab无限长一维原子链,固体物理 03-03一维双原子链
  17. PhotoShop批量生成App大小不同的Icon
  18. 几种SFTP SSH工具
  19. h5获取浏览器的相机和摄像头权限
  20. 查看进程名称 linux,在Linux系统服务器按名称查找进程的命令

热门文章

  1. xenserver 服务器退不出维护模式,xenserver 故障恢复问题总结
  2. 用组策略统一域中所有客户端桌面
  3. Python:从requests请求重试到万能重试装饰器
  4. 英特尔nuc能代替主机吗_小主机大行其道:英特尔今年还将推出NUC 11
  5. 迅睿CMS 万网虚拟主机无法连接数据库
  6. 自动化生产线中的生产节拍主要由工艺操作时间和辅助作业时间所组成
  7. Qt用CPU序列号来实现对软件简单的加密授权
  8. Android抽奖小程序
  9. uni-app学习(八)mapMutations和Mutations
  10. 人工智能视频增强Topaz Video Enhance AI