Java使用多线程做批处理(查询大量数据)

Java使用多线程做批处理(查询大量数据)

  • Java使用多线程做批处理(查询大量数据)
    • 前言背景
    • Java使用多线程的条件
    • 操作流程

前言背景

什么是进程
“进程”是操作系统的概念,一个独立运行的程序,就是一个“进程”。
什么是线程
“线程”是由“进程创建”的,一个进程可以创建任意多的线程,每个线程都包含一些代码。线程中的代码会同主进程或者其他线程“同时运行”。

什么是多进程
同一时间段,同时运行多个程序。
什么是多线程
一个程序同时启动多个线程,也就是多个代码块同时运行。从而提高程序的运行效率。

二、并发和并行
什么是并发
多个线程同时访问同一资源
例:你正在吃饭,有人来敲门,你放下饭碗去开门,回来接着吃饭。

什么是并行
多个线程同时开始运行
例:你正在吃饭,来电话啦,你边吃饭边打电话

Java使用多线程的条件

批处理(批量上传,批量导出,批量更新)

查询大量数据

本文以查询为例,展示一下线程池的使用。

本文使用的多线程框架是Executor

Executor 框架是 Java5 之后引进的,在 Java5 之后,通过Executor来启动线程比使用 Thread 的start方法更好

详情可以参考博客

https://else.wiki/post/JavaThreadPool

操作流程

  • 查询出表的数据总量。
  • 数据的切分,根据本机CPU的核数配置合适数量的线程处理数,根据数据总量为不同的线程分配不同的查询数据量分段,即不同的线程查询不同分段的数据。
  • 将各个查询数据的线程提交至线程池,这里使用的线程是带有返回结果的异步线程。(这样能把所有查询结果合并,才能进行下一步的操作。拿不到处理后的数据还怎么做下一步操作呢,所以一点要选择带有返回结果的线程)

为了例子足够简单,这里的数据总量直接写死,不去查询对应的数据库,我们的关注点放在,如何使用多线程以及多线程查询的结果合并,查询的表如下图,有1条数据,分成4个线程,每一个线程查询1条数据返回,最后把多个线程查询的数据合并

controller层

@Resource
private IBlogService blogService;@GetMapping("/testThredData")
public List testThredData(){return blogService.getAllResult();
}

service层

public interface IBlogService extends IService<Blog> {//每个线程分页查询public List<Blog> getQueryData(Integer start,Integer end);//合并线程结果public List getAllResult();
}

serviceImpl层

@Service
public class BlogServiceImpl extends ServiceImpl<BlogMapper, Blog> implements IBlogService {@Resourceprivate BlogMapper blogMapper;@Autowiredprivate MultiThreadQueryUtil multiThreadQueryUtil;//每个线程分页查询@Overridepublic List<Blog> getQueryData(Integer start, Integer end) {return this.blogMapper.getQueryData(start,end);}//合并线程结果@Overridepublic List getAllResult() {return multiThreadQueryUtil.getMultiCombineResult();}
}

multiThreadQueryUtil工具类

@Service
public class MultiThreadQueryUtil {/*** 获取多线程结果并进行结果合并* @return*/public List<List> getMultiCombineResult() {//开始时间long start = System.currentTimeMillis();//返回结果List<List> result = new ArrayList<>();//查询数据库总数量
//        int count = workflowTaskMapper.selectCountAll();
//        Map<String,String> splitMap = ExcelLocalUtils.getSplitMap(count,5);//假定总数据4条//Callable用于产生结果List<Callable<List>> tasks = new ArrayList<>();for (int i = 1; i <= 4; i++) {//不同的线程用户处理不同分段的数据量,这样就达到了平均分摊查询数据的压力//这里让每个线程每次查询一条数据int startNum =i-1;//对应的数据要和i挂钩 ,否则数据不变int endNum =i;Callable<List> qfe = new ThredQuery(startNum, endNum);tasks.add(qfe);   }try{//定义固定长度的线程池  防止线程过多,5就够用了
//            ExecutorService executorService = Executors.newFixedThreadPool(5);//4条数据,分成4个线程来查询ExecutorService executorService = Executors.newFixedThreadPool(4);//Future用于获取结果List<Future<List>> futures=executorService.invokeAll(tasks);//处理线程返回结果if(futures!=null&&futures.size() > 0){for (Future<List> future:futures){result.addAll(future.get());}}//关闭线程池,一定不能忘记executorService.shutdown();}catch (Exception e){e.printStackTrace();}long end = System.currentTimeMillis();System.out.println("线程查询数据用时:"+(end-start)+"ms");return result;}
}

Future相关的知识,可以参考这篇博客

https://blog.csdn.net/bobozai86/article/details/123978048
注意:startNum和endNum的值要和i相关,楼主一开始直接设固定值,通过自增来改变,后来发现这两个值没有变化,修改成和i相关即可解决

ThredQuery线程执行方法类

public class ThredQuery implements Callable<List> {public static SpringContextUtil springContextUtil = new SpringContextUtil();private int start;private int end;//每个线程查询出来的数据集合private List datas;public  ThredQuery(int start,int end) {this.start=start;this.end=end;//每个线程查询出来的数据集合
//        QueryService queryService= springContextUtil.getBean("queryService");//上面获取bean实例的方法可能会失效IBlogService blogService = springContextUtil.getBean(IBlogService.class);List count = blogService.getQueryData(start,end);datas = count;}//返回数据给Future@Overridepublic List call() throws Exception {return datas;}
}

这里线程继承了 Callable,多线程实现对list数据的处理

SpringContextUtil工具类

@Component
public class SpringContextUtil implements ApplicationContextAware {/*** 上下文对象实例*/private static ApplicationContext applicationContext;@Overridepublic void setApplicationContext(ApplicationContext applicationContext) throws BeansException {this.applicationContext = applicationContext;}/*** 获取applicationContext** @return*/public static ApplicationContext getApplicationContext() {return applicationContext;}/*** 获取HttpServletRequest*/public static HttpServletRequest getHttpServletRequest() {return ((ServletRequestAttributes) RequestContextHolder.getRequestAttributes()).getRequest();}public static String getDomain(){HttpServletRequest request = getHttpServletRequest();StringBuffer url = request.getRequestURL();return url.delete(url.length() - request.getRequestURI().length(), url.length()).toString();}public static String getOrigin(){HttpServletRequest request = getHttpServletRequest();return request.getHeader("Origin");}/*** 通过name获取 Bean.** @param name* @return*/public static Object getBean(String name) {return getApplicationContext().getBean(name);}/*** 通过class获取Bean.** @param clazz* @param       <T>* @return*/public static <T> T getBean(Class<T> clazz) {return getApplicationContext().getBean(clazz);}/*** 通过name,以及Clazz返回指定的Bean** @param name* @param clazz* @param       <T>* @return*/public static <T> T getBean(String name, Class<T> clazz) {return getApplicationContext().getBean(name, clazz);}
}

我们借助postman来测试一下,可以看到执行正常,不同的线程查询不同的数据,并合并在一起



Java使用多线程做批处理(查询大量数据)相关推荐

  1. 安卓 spinner下拉框 做模糊查询_SEO数据查询工具

    SEO数据查询工具是SEO工作中使用最频繁的工作,最常用的是站长之家(http://tool.chinaz.com/)以及爱站(http://www.aizhan.com/)的查询.这里主要介绍站长之 ...

  2. java中如何做模糊查询_到底Java里的模糊查询语句该怎么写

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 现在String sql="select * from car where carName like '%'+?+'%'";可以查询出 ...

  3. java对es做聚合查询_java操作elasticsearch实现聚合查询

    1.max 最大值 //max 求最大值 @Test public void test30() throws UnknownHostException{ //1.指定es集群 cluster.name ...

  4. Java就业方向有哪些?学习Java开发能做什么?

    学习Java开发都能做什么?Java主要应用在B/S和C/S领域.由于科技的不断发展,B/S将不足以满足社会需求,C/S将会是社会发展趋势.随着Servlet技术的使用,Java向Web移动设备方向挺 ...

  5. java使用多线程查询大批量数据

    前言 在某些时候,一旦单表数据量过大,查询数据的时候就会变得异常卡顿,虽然在大多数情况下并不需要查询所有的数据,而是通过分页或缓存的形式去减少或者避免这个问题,但是仍然存在需要这样的场景,比如需要导出 ...

  6. 多线程分批次查询数据

    多线程分批次查询数据 在springboot+mybaties系统中结合多线程实现分批次查询数据 在springboot+mybaties系统中结合多线程实现分批次查询数据 需求: 在系统开发和对接过 ...

  7. JDBC连接数据库:单线程、多线程、批处理插入数据的对比

    一.单线程(单条循环)插入50000条记录: 每执行一次就要访问一次数据库 import java.sql.Connection; import java.sql.DriverManager; imp ...

  8. java in查询无法查询到数据(mybatis字符#与字符$的区别)

    mybatis字符#与字符$的区别 问题:使用in查询查询出一批数据,in查询的参数是字符串拼接的.调试过程中,把mybatis输出的sql复制到navicat中,在控制台将sql的参数也复制出来,替 ...

  9. 【java 操作mysql】java连接mysql数据库并查询数据

    做java开发不可避免要处理数据库,所以这里写篇用jdbc来连接mysql的文章,java是一种高性能,通用的语言 .这使得它适合于编写高效的ETL生产代码和计算密集型的机器学习算法. 主要内容包括: ...

最新文章

  1. JAVA_OA管理系统(四)番外篇:使用Spring注解注入属性
  2. 绿联 蓝牙适配器 linux,绿联蓝牙适配器
  3. Flex Basis与Width的区别
  4. php7.0 cli,PHP-7.1 源代码学习:php-cli 启动流程
  5. logisim优先编码器怎么用_编码器简介、应用的stm32代码及注释
  6. 孤岛惊魂5服务器稳定吗,这才是《孤岛惊魂5》真正的“最低画质”
  7. python爬虫04--有道翻译
  8. filedisk学习资料
  9. R和Tableau平行坐标图
  10. kubernetes 简介:调度器和调度算法((Affinity/Anti-Affinity, Taints and Tolerations, 自定义调度器 )
  11. Logisim-Gates library
  12. icomoon图标字体的下载与使用
  13. Android 开发环境搭建
  14. 公司财务分析——收益性分析
  15. 傲腾服务器硬盘,Intel傲腾Optane硬盘实测:“高价U盘”,加速性能不错
  16. 河北计算机软件职业技术学院,河北软件职业技术学院2021年排名
  17. 桌面搜索项目正式启动
  18. Linux下的Hall sensor驱动
  19. 优秀的flash站点收集(30+)
  20. 读Runnable、collable、Excutor、Future文章总结

热门文章

  1. 057_Windows10平板模式
  2. DevExpress ASP.NET Wizard使用
  3. Nginx深入详解之upstream分配方式
  4. 盘点世界排名最前的5款开源ERP软件
  5. 购买二手房如何安全付款
  6. 用python画路飞代码_用python画个月亮_用python画月亮的代码 - CSDN
  7. 百度前端学院_小薇课堂_task3
  8. 汉诺塔——python递归
  9. 知窝:SEO经理面试100问-001
  10. linux之强大的sed