前言

最近生产环境有个老项目一直内存报警,不时的还出现内存泄漏,导致需要重启服务器,已经严重影响正常服务了。

分析

1.dump内存文件

liunx使用如下命令:

?

1

./jmap -dump:format=b,file=heap.hprof pid

2.使用Eclipse Memory Analysis进行分析

异常如下:

?

1

2

3

4

5

6

7

at org.apache.poi.xssf.usermodel.XSSFRow.<init>(Lorg/openxmlformats/schemas/spreadsheetml/x2006/main/CTRow;Lorg/apache/poi/xssf/usermodel/XSSFSheet;)V (XSSFRow.java:68)

at org.apache.poi.xssf.usermodel.XSSFSheet.initRows(Lorg/openxmlformats/schemas/spreadsheetml/x2006/main/CTWorksheet;)V (XSSFSheet.java:157)

at org.apache.poi.xssf.usermodel.XSSFSheet.read(Ljava/io/InputStream;)V (XSSFSheet.java:132)

at org.apache.poi.xssf.usermodel.XSSFSheet.onDocumentRead()V (XSSFSheet.java:119)

at org.apache.poi.xssf.usermodel.XSSFWorkbook.onDocumentRead()V (XSSFWorkbook.java:222)

at org.apache.poi.POIXMLDocument.load(Lorg/apache/poi/POIXMLFactory;)V (POIXMLDocument.java:200)

at org.apache.poi.xssf.usermodel.XSSFWorkbook.<init>(Ljava/io/InputStream;)V (XSSFWorkbook.java:179)

POI在加载Excel引发了内存泄漏,中间创建了大量的对象,占用了大量的内存

3.查看上传的Excel大小

经查看发现很多Excel大小在9M的文件

4.查看代码POI读取Excel的方式

发现使用的是用户模式,这样会占用大量的内存;POI提供了2中读取Excel的模式,分别是:

  • 用户模式:也就是poi下的usermodel有关包,它对用户友好,有统一的接口在ss包下,但是它是把整个文件读取到内存中的,
    对于大量数据很容易内存溢出,所以只能用来处理相对较小量的数据;
  • 事件模式:在poi下的eventusermodel包下,相对来说实现比较复杂,但是它处理速度快,占用内存少,可以用来处理海量的Excel数据。

经上面分析基本可以确定问题出在使用POI的用户模式去读取Excel大文件,导致内存泄漏。

本地重现

下面模拟一个600kb大小的Excel(test.xlsx),分别用两种模式读取,然后观察内存波动;

1.需要引入的库maven:

?

1

2

3

4

5

6

7

8

9

10

11

12

<dependencies>

 <dependency>

  <groupId>org.apache.poi</groupId>

  <artifactId>poi-ooxml</artifactId>

  <version>3.6</version>

 </dependency>

 <dependency>

  <groupId>com.syncthemall</groupId>

  <artifactId>boilerpipe</artifactId>

  <version>1.2.1</version>

 </dependency>

</dependencies>

2.用户模式代码如下:

?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

import java.io.File;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStream;

 

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.apache.poi.xssf.usermodel.XSSFWorkbook;

 

public class UserModel {

 

 public static void main(String[] args) throws InterruptedException {

  try {

   Thread.sleep(5000);

   System.out.println("start read");

   for (int i = 0; i < 100; i++) {

    try {

     Workbook wb = null;

     File file = new File("D:/test.xlsx");

     InputStream fis = new FileInputStream(file);

     wb = new XSSFWorkbook(fis);

     Sheet sheet = wb.getSheetAt(0);

     for (Row row : sheet) {

      for (Cell cell : row) {

       System.out.println("row:" + row.getRowNum() + ",cell:" + cell.toString());

      }

     }

    } catch (IOException e) {

     e.printStackTrace();

    }

   }

   Thread.sleep(1000);

  } catch (Exception e) {

   e.printStackTrace();

  }

 }

}

3.事件模式代码如下:

?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

import java.io.InputStream;

 

import org.apache.poi.openxml4j.opc.OPCPackage;

import org.apache.poi.xssf.eventusermodel.XSSFReader;

import org.apache.poi.xssf.model.SharedStringsTable;

import org.apache.poi.xssf.usermodel.XSSFRichTextString;

import org.xml.sax.Attributes;

import org.xml.sax.ContentHandler;

import org.xml.sax.InputSource;

import org.xml.sax.SAXException;

import org.xml.sax.XMLReader;

import org.xml.sax.helpers.DefaultHandler;

import org.xml.sax.helpers.XMLReaderFactory;

 

public class EventModel {

 

 public void processOneSheet(String filename) throws Exception {

  OPCPackage pkg = OPCPackage.open(filename);

  XSSFReader r = new XSSFReader(pkg);

  SharedStringsTable sst = r.getSharedStringsTable();

 

  XMLReader parser = fetchSheetParser(sst);

  InputStream sheet2 = r.getSheet("rId1");

  InputSource sheetSource = new InputSource(sheet2);

  parser.parse(sheetSource);

  sheet2.close();

 }

 

 public XMLReader fetchSheetParser(SharedStringsTable sst) throws SAXException {

  XMLReader parser = XMLReaderFactory.createXMLReader("org.apache.xerces.parsers.SAXParser");

  ContentHandler handler = new SheetHandler(sst);

  parser.setContentHandler(handler);

  return parser;

 }

 

 private static class SheetHandler extends DefaultHandler {

  private SharedStringsTable sst;

  private String lastContents;

  private boolean nextIsString;

 

  private SheetHandler(SharedStringsTable sst) {

   this.sst = sst;

  }

 

  public void startElement(String uri, String localName, String name, Attributes attributes) throws SAXException {

   if (name.equals("c")) {

    System.out.print(attributes.getValue("r") + " - ");

    String cellType = attributes.getValue("t");

    if (cellType != null && cellType.equals("s")) {

     nextIsString = true;

    } else {

     nextIsString = false;

    }

   }

   lastContents = "";

  }

 

  public void endElement(String uri, String localName, String name) throws SAXException {

   if (nextIsString) {

    int idx = Integer.parseInt(lastContents);

    lastContents = new XSSFRichTextString(sst.getEntryAt(idx)).toString();

    nextIsString = false;

   }

 

   if (name.equals("v")) {

    System.out.println(lastContents);

   }

  }

 

  public void characters(char[] ch, int start, int length) throws SAXException {

   lastContents += new String(ch, start, length);

  }

 }

 

 public static void main(String[] args) throws Exception {

  Thread.sleep(5000);

  System.out.println("start read");

  for (int i = 0; i < 100; i++) {

   EventModel example = new EventModel();

   example.processOneSheet("D:/test.xlsx");

   Thread.sleep(1000);

  }

 }

}

具体代码来源:http://poi.apache.org/spreadsheet/how-to.html#xssf_sax_api

4.设置VM arguments:-Xms100m -Xmx100m

UserModel运行结果直接报OutOfMemoryError,如下所示:

?

1

2

3

4

5

6

7

8

9

10

11

12

13

Exception in thread "main" java.lang.OutOfMemoryError: GC overhead limit exceeded

 at java.lang.String.substring(String.java:1877)

 at org.apache.poi.ss.util.CellReference.separateRefParts(CellReference.java:353)

 at org.apache.poi.ss.util.CellReference.<init>(CellReference.java:87)

 at org.apache.poi.xssf.usermodel.XSSFCell.<init>(XSSFCell.java:105)

 at org.apache.poi.xssf.usermodel.XSSFRow.<init>(XSSFRow.java:68)

 at org.apache.poi.xssf.usermodel.XSSFSheet.initRows(XSSFSheet.java:157)

 at org.apache.poi.xssf.usermodel.XSSFSheet.read(XSSFSheet.java:132)

 at org.apache.poi.xssf.usermodel.XSSFSheet.onDocumentRead(XSSFSheet.java:119)

 at org.apache.poi.xssf.usermodel.XSSFWorkbook.onDocumentRead(XSSFWorkbook.java:222)

 at org.apache.poi.POIXMLDocument.load(POIXMLDocument.java:200)

 at org.apache.poi.xssf.usermodel.XSSFWorkbook.<init>(XSSFWorkbook.java:179)

 at zh.excelTest.UserModel.main(UserModel.java:23)

UserModel模式下读取600kbExcel文件直接内存溢出,看了600kbExcel文件映射到内存中还是占用了不少内存;EventModel模式下可以流畅的运行。

5.设置VM arguments:-Xms200m -Xmx200m

UserModel模式和EventModel模式都可以正常运行,但是很明显UserModel模式回收内存更加频繁,而且在cpu的占用上更高。

总结

通过简单的分析以及本地运行两种模式进行比较,可以看到UserModel模式下使用的简单的代码实现了读取,但是在读取大文件时CPU和内存都不理想;

而EventModel模式虽然代码写起来比较繁琐,但是在读取大文件时CPU和内存更加占优。

Poi读取大数据量Excel文件相关推荐

  1. POI3.8解决导出大数据量excel文件时内存溢出的问题

    POI3.8解决导出大数据量excel文件时内存溢出的问题 参考文章: (1)POI3.8解决导出大数据量excel文件时内存溢出的问题 (2)https://www.cnblogs.com/feng ...

  2. SAP ABAP 探索 CL_FDT_XL_SPREADSHEET 读取大数据量 Excel 的可能性

    SAP ABAP 探索 CL_FDT_XL_SPREADSHEET 读取大数据量 Excel 的可能性 引言: 今时不同往日了,特别是在电商和零售行业中,动不动一个导入的 Excel 就有几十万行几十 ...

  3. 对大数据量Excel文件自动排版、转换成PDF用于印刷出版

    excel排版大师 下载  http://pan.baidu.com/s/1eQnY0hW 2015.3. 目录 一.主要功能 2 二.系统需求 3 三.文件名要求 3 四.目录说明: 4 1.Exc ...

  4. POI读写超大数据量Excel,解决超过几万行而导致内存溢出的问题(附源码)

    来源:cnblogs.com/swordfall/p/8298386.html 1. Excel2003与Excel2007 两个版本的最大行数和列数不同,2003版最大行数是65536行,最大列数是 ...

  5. 大数据量Excel Import导致OOM问题

    http://www.iteye.com/topic/199061 正在做一个Excel import的东东,不知道论坛上用POI的朋友有没有考虑过大数据量Excel文件导入导致内存溢出的问题 HSS ...

  6. Laravel 使用PHP_XLSXWriter实现大数据量Excel导出

    我在去年写过一篇关于laravel的Excel导出文章:Laravel Excel 实现 Excel/CSV 文件导入导出功能,使用的是Laravel Excel实现的. 该扩展包含Excel导入导出 ...

  7. QT 利用QAxObject大数据读写excel文件

    不知不觉已经加入CSDN很久了,但从来没有发过文章,最近开发了一个小工具踩了很多坑,主要是QT操作大数据Excel文件,现在和大家分享一下. 查阅了大部分资料,大数据读写excel文件用QAxObje ...

  8. Java操作大数据量Excel导入导出万能工具类(完整版)

    Java操作大数据量Excel导入导出万能工具类(完整版) 转载自:https://blog.csdn.net/JavaWebRookie/article/details/80843653 更新日志: ...

  9. MYSQL数据库导入大数据量sql文件失败的解决方案

    最快办法:执行下方语句,单次有效. SET GLOBAL max_allowed_packet=30*1024*1024 如果想彻底更改,在安装mysql的文件夹下找到my.ini 文件,在文件末尾添 ...

最新文章

  1. 框架退出的方法_AOP日志框架实现
  2. Hadoop编程调用HDFS
  3. java内部类的作用
  4. python爬取糗事百科
  5. 05精益敏捷项目管理——超越Scrum
  6. golang学习和使用经验总结
  7. 从dig命令理解DNS
  8. “抖音群控系统”教你如何抓住短视频时代风口,进行流量红利变现
  9. 用java 把字符串写进文本,Java将字符串写入文本文件代码示例
  10. VC资源编辑器里对话框的大小和实际的像素尺寸显示问题
  11. python3魔法方法_Python3 魔法方法详解
  12. 信息检索与利用(第三版)第三章信息素养
  13. ubuntu运行Openvino出现 ModuleNotFoundError: No module named ‘openvino.model_zoo.model_api‘解决
  14. STM32电子钟万年历Proteus仿真_LCD1602显示
  15. 计算机水平毕业研究生7分落户,研究生毕业如何进行上海积分落户?
  16. 什么是红黑树(内存最优的二叉树)
  17. RBM-MHC: A Semi-Supervised Machine-LearningMethod for Sample-Specific Prediction of AntigenPresent
  18. 仓库管理系统(WMS)有哪些好处?
  19. iview组件引入vue项目
  20. 超简单的React项目打包后部署到服务器上

热门文章

  1. Echart API
  2. dji大疆机器人冬令营_一文看懂大疆的青少年机器人教育解决方案
  3. 超火的壁纸网站,强烈推荐收藏!
  4. 电阻色环查询器[原创]
  5. 三维点云到人体重建(七)
  6. 内存数据库应用之NBA篮球图文直播室存储设计
  7. 10个适合于高级Java开发人员的外国网站
  8. Fiddler的安装和简单使用
  9. 原生JS实现抛物线动画以及动态模糊效果
  10. Python爬取微博热搜榜,将数据存入数据库