本文主要对Excel中数据的解析和生成进行总结


前言

在应用程序的开发过程中,我们经常要用到Excel进行数据的导入或导出。所以,在通过Java语言实现此类需求时,通常会对Excel文件进行解析或生成。


一、Excel文件解析

1,概述

在应用程序开发过程中,经常需要使用Excel文件来进行数据的导入或导出。所以,在通过Java语言来实现此类需求的时候,往往会面临着Excel文件解析(导入)或生成(导出)。

在Java技术生态圈中,可以进行Excel问价处理的主流技术包括:Apache POI,JXL,Alibaba EasyExcel等。

Apache POI基于DOM方式进行解析,将文件直接加载内存,所以速度较快,适合Excel文件数量不大的应用场景。JXL只支持Excel2003以下版本,所以不太常见。

Alibaba EasyExcel采用逐行读取的解析模式,将每一行的解析结果以观察者模式通知处理(AnalyEventListener),所以比较适合数据体量较大的Excel文件解析。

2,  Apache POI
         Apache POI使用Java编写的免费开源的跨平台的Java API。Apache POI提供给Java程序对Microso Office 格式档案进行读写功能的API开源类库

HSSF :提供读写Microsoft Excel格式档案的功能。

XSSF :提供读写Microsoft Excel 0OXML格式档案的功能。HWPF

HWPF :  提供读写Microsoft Word格式档案的功能。

HSLF  :  提供读写Microsoft PowerPoint格式档案的功能。

HDGF  :  提供读写Microsoft Visio格式档案的功能。
3, XSSF解析Excel文件

HSSF用于解析旧版本(*.xls) Excel文件, 由于旧版本的Excel文件只能存在65535行数据, 所以目前已经不常用。所以目前主要采用XSSF进行新版本(*.xlsx) Exce文件的解析。

导入下图中的架包:

Workbook (Excel文件)

Workbook接口代表一一个 Excel文件,用于创建或加载(解析)见实现类是XSSFWorkbook。

创建Excel文件:

// 输出流
FileOutputStream fos = new FileOutputStream("c:\\test\\temp.xlsx");// Excel文件对象
Workbook workbook = new XSSFWorkbook();// 通过输出流进行写入
workbook.write(fos);// 关闭资源
fos.close();
workbook.close();
try (Workbook workbook = new XSSFWorkbook();FileOutputStream fos = new FileOutputStream("c:\\test\\temp.xlsx")) {workbook.write(fos);
} catch (IOException e) {e.printStackTrace();
}

解析Excel文件

// 输入流
FileInputStream fis = new FileInputStream("c:\\test\\12345.xlsx");// Excel文件对象
Workbook workbook = new XSSFWorkbook(fis);

Sheet(工作簿)

通过Workbook来进行工作簿Sheet对象的获取或创建。

创建工作簿

// 按照默认名称创建工作簿
Sheet sheet1 = workbook.createSheet();// 按照自定义名称创建工作簿
Sheet sheet2 = workbook.createSheet("自定义工作簿2");

获取工作簿

// 按照工作簿下标获取Sheet
Sheet sheet01 = workbook.getSheetAt(0);// 按照工作簿名称获取Sheet
Sheet sheet02 = workbook.getSheet("Sheet0");

获取工作簿数量

int n = workbook.getNumberOfSheets();

Row (数据行)

通过Sheet 来进行数据行Row 对象的获取或创建

获取首行下标

int first = sheet.getFirstRowNum();

获取末尾行下标

int last = sheet.getLastRowNum();

根据下标获取指定行

Row row = sheet.getRow(0);

遍历所有行

for(Row row : sheet) {
    System.out.println(row);
}

遍历指定区域行

for (int i = 1; i <= sheet.getLastRowNum(); i++) {
    Row row = sheet.getRow(i);
    System.out.println(row);
}

Cell (单元格)

通过Row 来进行单元格Cell 对象的获取或创建

创建单元格

Cell cell0 = row.createCell(0);

设置单元格值

cell0.setCellValue(UUID.randomUUID().toString());

遍历所有单元格

for(Cell cell : row) {
                
}

获取所有单元格类型

CellType type = cell.getCellType();

设置单元格样式

// 创建单元格样式
DataFormat dataFormat = workbook.createDataFormat();
Short formatCode = dataFormat.getFormat("yyyy-MM-dd HH:mm:ss");
CellStyle cellStyle = workbook.createCellStyle();
cellStyle.setDataFormat(formatCode);// ...// 为当前行创建单元格
Cell cell1 = row.createCell(1);
cell1.setCellStyle(cellStyle); // 设置单元格样式
cell1.setCellValue(new Date()); // 保存当前日期时间至本单元格

设置单元格对齐

// 创建单元格样式
CellStyle cellStyle = workbook.createCellStyle();//设置单元格的水平对齐类型。 此时水平居中
cellStyle.setAlignment(HorizontalAlignment.CENTER);// 设置单元格的垂直对齐类型。 此时垂直靠底边
cellStyle.setVerticalAlignment(VerticalAlignment.BOTTOM);

二、超大Excel文件读写

1,使用POI写入

package Myde;import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.Arrays;
import java.util.Date;
import java.util.List;import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.CellStyle;
import org.apache.poi.ss.usermodel.DataFormat;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;public class Demo06{public static void main(String[] args) {//List<String> list= Arrays.asList("AA","BB","CC","DD","EE","FF");//读取一个已存在的Excel文件try (Workbook workbook=new SXSSFWorkbook(1000);FileOutputStream out=new FileOutputStream("D:\\demo-data.xlsx")){//在已经存在的Excel文件中,创建一个新的sheetSheet sheet=workbook.createSheet();//获取格式编码值DataFormat dataformat=workbook.createDataFormat();short dateformatCode=dataformat.getFormat("yy年MM月dd日 HH:mm:ss");short moneyformatCode=dataformat.getFormat("¥#,###");//创建日期格式对象CellStyle datecellstyle=workbook.createCellStyle();datecellstyle.setDataFormat(dateformatCode);//创建货币格式对象CellStyle moneycellstyle=workbook.createCellStyle();moneycellstyle.setDataFormat(moneyformatCode);;//创建列头Row headrow=sheet.createRow(0);Cell headcell0=headrow.createCell(0);headcell0.setCellValue("序号");Cell headcell1=headrow.createCell(1);headcell1.setCellValue("姓名");Cell headcell2=headrow.createCell(2);headcell2.setCellValue("日期");Cell headcell3=headrow.createCell(3);headcell3.setCellValue("红包金额");long begin=System.currentTimeMillis();for(int i=0;i<1000000;i++) {//String name=list.get(i);String name=i+"A";//创建行Row row=sheet.createRow(i+1);//创建单元格Cell cell0=row.createCell(0);//序号cell0.setCellValue(String.valueOf(i+1));Cell cell1=row.createCell(1);//姓名cell1.setCellValue(name);Cell cell2=row.createCell(2);//日期cell2.setCellStyle(datecellstyle);cell2.setCellValue(new Date());Cell cell3=row.createCell(3);//金额cell3.setCellStyle(moneycellstyle);cell3.setCellValue(Math.random()*1000000);}//写入文件workbook.write(out);long end=System.currentTimeMillis();System.out.println("耗时"+(end-begin)+"毫秒");} catch (IOException e) {e.printStackTrace();}}}

可以看到使用SXSSDWorkbook的执行时间为:

2.使用EasyExcel

(1)下载alibaba easyexcel相关jar包

(2)  订单实体类Order

public class Order {@ExcelProperty("订单编号")private String orderId; // 订单编号@ExcelProperty("支付金额")@NumberFormat("¥#,###")private Double payment; // 支付金额@ExcelProperty(value = "创建日期",converter = LocalDateTimeConverter.class)private LocalDateTime creationTime; // 创建时间public Order() {this.orderId = LocalDateTime.now().format(DateTimeFormatter.ofPattern("yyyyMMddhhmmss"))+ UUID.randomUUID().toString().substring(0, 5);this.payment = Math.random() * 10000;this.creationTime = LocalDateTime.now();}public String getOrderId() {return orderId;}public void setOrderId(String orderId) {this.orderId = orderId;}public Double getPayment() {return payment;}public void setPayment(Double payment) {this.payment = payment;}public LocalDateTime getCreationTime() {return creationTime;}public void setCreationTime(LocalDateTime creationTime) {this.creationTime = creationTime;}@Overridepublic String toString() {return "Order [orderId=" + orderId + ", payment=" + payment + ", creationTime=" + creationTime + "]";}
}

(3)Converter转换类(兼容LocalDateTime日期时间类)

public class LocalDateTimeConverter implements Converter<LocalDateTime> {@Overridepublic Class<LocalDateTime> supportJavaTypeKey() {return LocalDateTime.class;}@Overridepublic CellDataTypeEnum supportExcelTypeKey() {return CellDataTypeEnum.STRING;}@Overridepublic LocalDateTime convertToJavaData(CellData cellData, ExcelContentProperty contentProperty,GlobalConfiguration globalConfiguration) {return LocalDateTime.parse(cellData.getStringValue(), DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss"));}@Overridepublic CellData<String> convertToExcelData(LocalDateTime value, ExcelContentProperty contentProperty,GlobalConfiguration globalConfiguration) {return new CellData<>(value.format(DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss")));}}

(4)写入100w条数据

public class Demo {public static void main(String[] args) {// 写入100wEasyExcel.write("c:\\test\\run\\easy.xlsx", Order.class).sheet("订单列表").doWrite(data());}// 创建100w条订单数据private static List<Order> data() {List<Order> list = new ArrayList<Order>();for (int i = 0; i < 1000000; i++) {list.add(new Order());}return list;}
}

(5)读取100w条数据

EasyExcel.read("c:\\test\\run\\easy.xlsx", Order.class,new AnalysisEventListener<Order>() {@Overridepublic void invoke(Order order, AnalysisContext arg1) {// 读取每条数据orderList.add(order);}@Overridepublic void invokeHeadMap(Map<Integer, String> headMap, AnalysisContext context) {// 读取到列头System.out.println(headMap);}@Overridepublic void doAfterAllAnalysed(AnalysisContext arg0) {// 读取完毕System.out.println("END");}
}).sheet().doRead();

EasyExcel的执行时间为

可以看到两种方法时间相差不大,但在运行时,CPU的利用率还是有一定差距。

POI:

EasyExcel:

从此可以得出,在读写超大Excel文件时,我推荐大家使用EasyExcel。


总结

  1. Excel文件解析  apache POI,可以解析world和Excel
  2. getRow(),获取行    lastRoeNumber() 最后一个,getCell()按下标获取当前行的单元格
  3. GetStringCellValue() -->文本     getNumberCellValue() -->数字
  4. Workbook.createSheet() 创建表格
  5. CellStyle单元格格式
  6. Excel文件对象  Workbook workbook=new XSSFEorkbook()
  7. 创建工作簿  Sheet sheet1=workbook.createSheet();
  8. 按照工作簿下标获取Sheet  Sheet sheet1=workbook.getSheetAt(0);
  9. 遍历所有行for(Row row:sheet){System.out.println(row);}

java中 Excel文件解析及超大Excel文件读写相关推荐

  1. Java中使用poi导入、导出Excel

    Java中使用poi导入.导出Excel 学习了:http://www.cnblogs.com/Damon-Luo/p/5919656.html 转载于:https://www.cnblogs.com ...

  2. JAVA中利用DOM解析XML文档

    JAVA中利用DOM解析XML文档 package org.sws.utils; import java.io.File;import java.io.IOException; import java ...

  3. java解析xml实例_在java中使用dom解析xml的示例分析

    本篇文章介绍了,在java中使用dom解析xml的示例分析.需要的朋友参考下 dom是个功能强大的解析工具,适用于小文档 为什么这么说呢?因为它会把整篇xml文档装载进内存中,形成一颗文档对象树 总之 ...

  4. java中如何生成可执行的jar文件

    java中如何生成可执行的jar文件最简单的方法就是:jar -cfe Card.jar CardLayoutDemo CardLayoutDemo$1.class CardLayoutDemo$my ...

  5. JAVA中opencsv包解析CSV大文件

    业务的诞生 最近有些从大数据部门下载的基础数据,并已csv格式存储的,其中一些单个文件中数据量达到200W条.现在需要我把文件重新解析一次.因为其中一个表头对应的值是一个{key1=value1, k ...

  6. csv和excel php 解析_php读取csv文件(excel可另存为csv格式文件)

    csv文件简介 看到这个题目大家一定莫名其妙,这个csv文件和office有啥关系.呵呵,细心地朋友在用excel的时候会发现,excel可以另存为csv格式.我之前也对这个东西没什么了解,只是知道e ...

  7. java怎么xml文件解析_Java对Xml文件解析

    JAVA 解析 XML 通常有两种方式,DOM 和 SAX. DOM 虽然是 W3C 的标准,提供了标准的解析方式,但它的解析效率一直不尽如人意,因为使用DOM解析XML时,解析器读入整个文档并构建一 ...

  8. Java中的XML解析

    前言 这几天在手写Spring IOC的时候遇上了xml文件的解析,通过解析Spring.xml配制文件的方式来创建对象.因为之前从来都没遇见过相关的需求,所以对此做一份记录 XML (eXtensi ...

  9. 集合类 Java中的集合类解析和一些有深入的面试题

    Java集合类解析 List.Map.Set三个接口,存取元素时,各有什么特点? List 以特定次序来持有元素,可有重复元素.Set 无法拥有重复元素,内部排序.Map 保存key-value值,v ...

最新文章

  1. codeigniter配置smarty模板
  2. 一个BADI中实施多个Implementation
  3. NYOJ 640 Geometric Sum
  4. python爬斗鱼直播_Python爬取2000万直播数据——看20万游戏主播能否月入100万
  5. php 栈、 出栈、入栈
  6. CentOS7安装VPP(FD.io)
  7. cmd 取消点击锁定功能
  8. Python之手把手教你用JS逆向爬取网易云40万+评论并用stylecloud炫酷词云进行情感分析
  9. Abseil之拆分字符串
  10. [插件使用] 介绍与使用番茄助手
  11. 使用HTML实现图片切换/轮播
  12. UNews | 1.8亿!优维科技完成C轮融资!
  13. 98% after emitting CopyPlugin问题
  14. python批量下载模库网图片
  15. FSL之bet颅骨剥离
  16. 利用matlab的interp1()对矩阵进行插值
  17. java中的线程池有哪些,分别有什么作用?
  18. NSRunLoop的用法
  19. Firefox for Android 代理设置
  20. #每天一道算法题:出现一次与出现k次的数

热门文章

  1. 批判性思维如何养成?
  2. 双因素认证,让用户的帐号安全无忧
  3. 通讯录——java课程设计
  4. grid_map(五):grid_map函数定义、类型定义学习
  5. PAT 7-5 哥尼斯堡的“七桥问题” (25 分)(解题报告)
  6. SSCNet环境搭建
  7. firebase在项目中常用的方法
  8. 171023_矩阵特征值和矩阵函数
  9. Maven导入依赖时jar包出现unknown
  10. 什么是预言机(oracle)