http://blog.csdn.net/qq547276542/article/details/75097602

最近的项目需要导入大量的数据,插入的过程中还需要边查询边插入。插入的数据量在100w左右。一开始觉得100w的数据量不大,于是就插啊插,吃了个饭,回来一看,在插入了50多w条数据后,每秒就只能插10条了。。觉得很奇怪,为啥越插越慢呢?  于是就开始分析插入的时间损耗,想到了如下的解决方案:(mysql使用的INNODB引擎)

1.分析是否是由主码,外码,索引造成的插入效率降低

主码:由于主码是每张表必须有的,不能删除。而mysql会对主码自动建立一个索引,这个索引默认是Btree索引,因此每次插入数据要额外的对Btree进行一次插入。这个额外的插入时间复杂度约为log(n)。这个索引无法删除,因此无法优化。但是每次插入的时候,由于主码约束需要检查主码是否出现,这又需要log(n),能否减少这个开销呢?答案是肯定的。我们可以设置主码为自增id  AUTO_INCREMENT ,这样数据库里会自动记录当前的自增值,保证不会插入重复的主码,也就避免了主码的重复性检查。

外码:由于我的项目的插入表中存在外码,因此每次插入时需要在另一张表检测外码存在性。这个约束是与业务逻辑相关的,不能随便删除。并且这个时间开销应当是与另一张表大小成正比的常数,不应当越插入越慢才对。所以排除。

索引:为了减少Btree插入的时间损耗,我们可以在建表时先不建索引,先将所有的数据插入。之后我们再向表里添加索引。该方法确实也降低了时间的开销。

经过以上的折腾,再进行测试,发现速度快了一点,但是到了50w条后又开始慢了。看来问题的关键不在这里。于是继续查资料,又发现了个关键问题:

2.将单条插入改为批量插入(参考:点击打开链接)

由于java中的executeUpdate(sql)方法只是执行一条sql操作,就需要调用sql里的各种资源,如果使用for循环不停的执行这个方法来插入,无疑是开销很大的。因此,在mysql提供了一种解决方案:批量插入。 也就是每次的一条sql不直接提交,而是先存在批任务集中,当任务集的大小到了指定阈值后,再将这些sql一起发送至mysql端。在100w的数据规模中,我将阈值设置为10000,即一次提交10000条sql。最后的结果挺好,插入的速度比之前快了20倍左右。批量插入代码如下:

[java] view plaincopy
  1. public static void insertRelease() {
  2. Long begin = new Date().getTime();
  3. String sql = "INSERT INTO tb_big_data (count, create_time, random) VALUES (?, SYSDATE(), ?)";
  4. try {
  5. conn.setAutoCommit(false);
  6. PreparedStatement pst = conn.prepareStatement(sql);
  7. for (int i = 1; i <= 100; i++) {
  8. for (int k = 1; k <= 10000; k++) {
  9. pst.setLong(1, k * i);
  10. pst.setLong(2, k * i);
  11. pst.addBatch();
  12. }
  13. pst.executeBatch();
  14. conn.commit();
  15. }
  16. pst.close();
  17. conn.close();
  18. } catch (SQLException e) {
  19. e.printStackTrace();
  20. }
  21. Long end = new Date().getTime();
  22. System.out.println("cast : " + (end - begin) / 1000 + " ms");
  23. }

3.一条UPDATE语句的VALUES后面跟上多条的(?,?,?,?)

这个方法一开始我觉得和上面的差不多,但是在看了别人做的实验后,发现利用这个方法改进上面的批量插入,速度能快5倍。后来发现,mysql的导出sql文件中,那些插入语句也是这样写的。。即UPDATE table_name (a1,a2) VALUES (xx,xx),(xx,xx),(xx,xx)... 。也就是我们需要在后台自己进行一个字符串的拼接,注意由于字符串只是不停的往末尾插入,用StringBuffer能够更快的插入。下面是代码:

[java] view plaincopy
  1. public static void insert() {
  2. // 开时时间
  3. Long begin = new Date().getTime();
  4. // sql前缀
  5. String prefix = "INSERT INTO tb_big_data (count, create_time, random) VALUES ";
  6. try {
  7. // 保存sql后缀
  8. StringBuffer suffix = new StringBuffer();
  9. // 设置事务为非自动提交
  10. conn.setAutoCommit(false);
  11. // Statement st = conn.createStatement();
  12. // 比起st,pst会更好些
  13. PreparedStatement pst = conn.prepareStatement("");
  14. // 外层循环,总提交事务次数
  15. for (int i = 1; i <= 100; i++) {
  16. // 第次提交步长
  17. for (int j = 1; j <= 10000; j++) {
  18. // 构建sql后缀
  19. suffix.append("(" + j * i + ", SYSDATE(), " + i * j
  20. * Math.random() + "),");
  21. }
  22. // 构建完整sql
  23. String sql = prefix + suffix.substring(0, suffix.length() - 1);
  24. // 添加执行sql
  25. pst.addBatch(sql);
  26. // 执行操作
  27. pst.executeBatch();
  28. // 提交事务
  29. conn.commit();
  30. // 清空上一次添加的数据
  31. suffix = new StringBuffer();
  32. }
  33. // 头等连接
  34. pst.close();
  35. conn.close();
  36. } catch (SQLException e) {
  37. e.printStackTrace();
  38. }
  39. // 结束时间
  40. Long end = new Date().getTime();
  41. // 耗时
  42. System.out.println("cast : " + (end - begin) / 1000 + " ms");
  43. }

做了以上的优化后,我发现了一个很蛋疼的问题。虽然一开始的插入速度的确快了几十倍,但是插入了50w条数据后,插入速度总是会一下突然变的非常慢。这种插入变慢是断崖式的突变,于是我冥思苦想,无意中打开了系统的资源管理器,一看发现:java占用的内存在不断飙升。 突然脑海中想到:是不是内存溢出了?

4.及时释放查询结果

在我的数据库查询语句中,使用到了pres=con.prepareStatement(sql)来保存一个sql执行状态,使用了resultSet=pres.executeQuery来保存查询结果集。而在边查边插的过程中,我的代码一直没有把查询的结果给释放,导致其不断的占用内存空间。当我的插入执行到50w条左右时,我的内存空间占满了,于是数据库的插入开始不以内存而以磁盘为介质了,因此插入的速度就开始变得十分的低下。因此,我在每次使用完pres和resultSet后,加入了释放其空间的语句:resultSet.close(); pres.close(); 。重新进行测试,果然,内存不飙升了,插入数据到50w后速度也不降低了。原来问题的本质在这里!

这个事情折腾了一天,也学到了很多。希望这篇博客能帮助到大家!

(百万数据量级别)java下的mysql数据库插入越插越慢的问题解决相关推荐

  1. mysql java datetime_Java向mysql数据库插入datetime类型数据实例(精)

    在Mysql数据库中日期跟时间有两种: 1.date类型,date类型也就是我们常见的储存yyyy-MM-dd类型的日期,它不能储存时间,也就是只能储存日期, 2.dateitme就是可以储存日期同时 ...

  2. java关闭数据库连接语句,java下连接mysql数据库 ——删除语句——delete

    packagerjcs;import java.sql.*;public classlianjmysql {//MySQL 8.0 以下版本 - JDBC 驱动名及数据库 URL static fin ...

  3. java mybatis向mysql数据库插入中文出现乱码

    为什么80%的码农都做不了架构师?>>>    1.检查数据库编码是不是UTF-8(一般都是使用UTF-8) 2.检查mybatis数据库连接字符串dbc:mysql://ip:33 ...

  4. Java程序向MySql数据库中插入的中文数据变成了问号

    找到mysql的安装目录,修改my.ini文件 (1)如何找到my.ini文件 如果my.ini文件不在MySQL的安装目录下,可能放在隐藏目录,要先去找到ProgramData,(这里要先打开显示隐 ...

  5. java mysql插入数据乱码_java向mysql数据库插入数据显示乱码的问题

    在做一个java web工程时,有时会碰到在向数据库添加数据库时,结果出现乱码"???"的问题.针对该问题的主要解决办法就是: 一.确保是否添加了字符集过滤器: 在java web ...

  6. java向mysql写入数据慢_通过java代码往mysql数据库中写入日期相关数据少13个小时...

    通过show variables like '%time_zone%'; 查看时区: CST 时区 名为 CST 的时区是一个很混乱的时区,有四种含义: 美国中部时间 Central Standard ...

  7. linux mysql 数据文件,Linux下修改MySQL数据库数据文件路径的步骤

    使用rpm安装方式安装完MySQL数据库后,数据文件的默认路径为/var/lib/mysql,然而根目录并不适合用于存储数据文件. 原路径:/var/lib/mysql 目标路径:/home/mysq ...

  8. linux的mysql主主_Linux下指定mysql数据库数据配置主主同步的实例

    一. 概念:① 数据库同步  (主从同步 --- 主数据库写的同时 往从服务器写数据) ② 数据库同步  (主主同步 --- 两台数据库服务器互相写数据) 二. 举例 主主数据库同步服务器配置 数据库 ...

  9. 脚本同步mysql数据_windows下数据库文件使用脚本同步到linux下的mysql数据库中

    1.背景 windows server 2008 下 每天会有 *.sql数据文件 需要上传到linux 中的mysql数据库中 而运维人员是在 windows server 下使用 xshell 连 ...

  10. Java如何给Mysql中插入year类型数据

    文章目录 Java如何给Mysql中插入year类型数据 实际问题: 解决方案: 从数据库中读取year类型数据到Java 从Java中往数据库存储year数据 Java如何给Mysql中插入year ...

最新文章

  1. SQL Server 2008 R2中文版快速安装
  2. 最近公共祖先 LCA Tarjan算法
  3. 一个半径为r的球体均匀带电_静电现象——一个易被忽略的细节
  4. 三步更改win7开机密码
  5. 关于一部分数学知识》(工具向)(实时更新)
  6. Python---二分法查找
  7. 二级高级应用计算机考试环境,1.2 上机考试环境免费阅读_全国计算机等级考试无纸化真考题库二级MS Office高级应用免费全文_百度阅读...
  8. WPF的ComboBox 数据模板自定义
  9. WCF 第五章 行为 事务之选择一个事务协议-OleTx 或者WS-AT
  10. 记录MySql错误消息
  11. workman 心跳
  12. Linux+Ubuntu
  13. C++ Primer 第5版 练习5.14
  14. 阿里云datav自定义组件,引入高德地图API
  15. 大学c语言程序中if语句,浅谈C语言中if语句
  16. 电子学会青少年软件编程 Python编程等级考试三级真题解析(选择题)2021年3月
  17. 创建一个新用户身份为计算机管理员,以Guest账户身份创建一个管理员
  18. note4 android5.1.1,三星N9109W note4安卓5.1.1五件套刷机包固件N9109WKEU1COL5
  19. 我的桌面布局(网络安全软件推荐)
  20. swiper修改轮播图下面小圆圈样式

热门文章

  1. Android 不自动弹出软键盘
  2. WebForm读取指定的config文件的内容
  3. (宇哥云端)互联网+
  4. [揭秘]如何通过“人工智能”对直播的内容风险防控
  5. js里写网页结构, 传函数参数
  6. Android 透明颜色值ARGB
  7. mysql二进制安装shell脚本,一分钟就搞好linux上的mysql
  8. PoJ3278--Catch That Cow(Bfs)
  9. 移动开发的那些事(上)
  10. 动态组合sql语句详解