0


java中 Excel文件解析及超大Excel文件读写

本文主要对Excel中数据的解析和生成进行总结


前言

  1. 在应用程序的开发过程中,我们经常要用到Excel进行数据的导入或导出。所以,在通过Java语言实现此类需求时,通常会对Excel文件进行解析或生成。

一、Excel文件解析

1,概述

  1. 在应用程序开发过程中,经常需要使用Excel文件来进行数据的导入或导出。所以,在通过Java语言来实现此类需求的时候,往往会面临着Excel文件解析(导入)或生成(导出)。
  2. Java技术生态圈中,可以进行Excel问价处理的主流技术包括:Apache POIJXLAlibaba EasyExcel等。
  3. Apache POI基于DOM方式进行解析,将文件直接加载内存,所以速度较快,适合Excel文件数量不大的应用场景。JXL只支持Excel2003以下版本,所以不太常见。
  4. Alibaba EasyExcel采用逐行读取的解析模式,将每一行的解析结果以观察者模式通知处理(AnalyEventListener),所以比较适合数据体量较大的Excel文件解析。

2, Apache POI
Apache POI使用Java编写的免费开源的跨平台的Java API。Apache POI提供给Java程序对Microso Office 格式档案进行读写功能的API开源类库

HSSF :提供读写Microsoft Excel格式档案的功能。

XSSF :提供读写Microsoft Excel 0OXML格式档案的功能。HWPF

HWPF : 提供读写Microsoft Word格式档案的功能。

HSLF : 提供读写Microsoft PowerPoint格式档案的功能。

HDGF : 提供读写Microsoft Visio格式档案的功能。
3, XSSF解析Excel文件

HSSF用于解析旧版本(.xls) Excel文件, 由于旧版本的Excel文件只能存在65535行数据, 所以目前已经不常用。所以目前主要采用XSSF进行新版本(.xlsx) Exce文件的解析。

  1. 导入下图中的架包:
  2. ![](https://img-blog.csdnimg.cn/8262fc7c0215428ca748caba5e8b3981.png)

Workbook (Excel文件)

Workbook接口代表一一个 Excel文件,用于创建或加载(解析)见实现类是XSSFWorkbook。

  1. 创建Excel文件:
  1. // 输出流
  2. FileOutputStream fos = new FileOutputStream("c:\\test\\temp.xlsx");
  3. // Excel文件对象
  4. Workbook workbook = new XSSFWorkbook();
  5. // 通过输出流进行写入
  6. workbook.write(fos);
  7. // 关闭资源
  8. fos.close();
  9. workbook.close();
  1. try (Workbook workbook = new XSSFWorkbook();
  2. FileOutputStream fos = new FileOutputStream("c:\\test\\temp.xlsx")) {
  3. workbook.write(fos);
  4. } catch (IOException e) {
  5. e.printStackTrace();
  6. }

解析Excel文件

  1. // 输入流
  2. FileInputStream fis = new FileInputStream("c:\\test\\12345.xlsx");
  3. // Excel文件对象
  4. Workbook workbook = new XSSFWorkbook(fis);

Sheet(工作簿)

通过Workbook来进行工作簿Sheet对象的获取或创建。

创建工作簿

  1. // 按照默认名称创建工作簿
  2. Sheet sheet1 = workbook.createSheet();
  3. // 按照自定义名称创建工作簿
  4. Sheet sheet2 = workbook.createSheet("自定义工作簿2");

获取工作簿

  1. // 按照工作簿下标获取Sheet
  2. Sheet sheet01 = workbook.getSheetAt(0);
  3. // 按照工作簿名称获取Sheet
  4. Sheet sheet02 = workbook.getSheet("Sheet0");

获取工作簿数量

  1. int n = workbook.getNumberOfSheets();

Row (数据行)

通过Sheet 来进行数据行Row 对象的获取或创建

获取首行下标

int first = sheet.getFirstRowNum();

获取末尾行下标

int last = sheet.getLastRowNum();

根据下标获取指定行

Row row = sheet.getRow(0);

遍历所有行

for(Row row : sheet) {
System.out.println(row);
}

遍历指定区域行

for (int i = 1; i <= sheet.getLastRowNum(); i++) {
Row row = sheet.getRow(i);
System.out.println(row);
}

Cell (单元格)

通过Row 来进行单元格Cell 对象的获取或创建

创建单元格

Cell cell0 = row.createCell(0);

设置单元格值

cell0.setCellValue(UUID.randomUUID().toString());

遍历所有单元格

for(Cell cell : row) {

}

获取所有单元格类型

CellType type = cell.getCellType();

设置单元格样式

  1. // 创建单元格样式
  2. DataFormat dataFormat = workbook.createDataFormat();
  3. Short formatCode = dataFormat.getFormat("yyyy-MM-dd HH:mm:ss");
  4. CellStyle cellStyle = workbook.createCellStyle();
  5. cellStyle.setDataFormat(formatCode);
  6. // ...
  7. // 为当前行创建单元格
  8. Cell cell1 = row.createCell(1);
  9. cell1.setCellStyle(cellStyle); // 设置单元格样式
  10. cell1.setCellValue(new Date()); // 保存当前日期时间至本单元格

设置单元格对齐

  1. // 创建单元格样式
  2. CellStyle cellStyle = workbook.createCellStyle();
  3. //设置单元格的水平对齐类型。 此时水平居中
  4. cellStyle.setAlignment(HorizontalAlignment.CENTER);
  5. // 设置单元格的垂直对齐类型。 此时垂直靠底边
  6. cellStyle.setVerticalAlignment(VerticalAlignment.BOTTOM);

二、超大Excel文件读写

1,使用POI写入

  1. package Myde;
  2. import java.io.FileInputStream;
  3. import java.io.FileOutputStream;
  4. import java.io.IOException;
  5. import java.util.Arrays;
  6. import java.util.Date;
  7. import java.util.List;
  8. import org.apache.poi.ss.usermodel.Cell;
  9. import org.apache.poi.ss.usermodel.CellStyle;
  10. import org.apache.poi.ss.usermodel.DataFormat;
  11. import org.apache.poi.ss.usermodel.Row;
  12. import org.apache.poi.ss.usermodel.Sheet;
  13. import org.apache.poi.ss.usermodel.Workbook;
  14. import org.apache.poi.xssf.streaming.SXSSFWorkbook;
  15. import org.apache.poi.xssf.usermodel.XSSFWorkbook;
  16. public class Demo06{
  17. public static void main(String[] args) {
  18. //List<String> list= Arrays.asList("AA","BB","CC","DD","EE","FF");
  19. //读取一个已存在的Excel文件
  20. try (Workbook workbook=new SXSSFWorkbook(1000);
  21. FileOutputStream out=new FileOutputStream("D:\\demo-data.xlsx")){
  22. //在已经存在的Excel文件中,创建一个新的sheet
  23. Sheet sheet=workbook.createSheet();
  24. //获取格式编码值
  25. DataFormat dataformat=workbook.createDataFormat();
  26. short dateformatCode=dataformat.getFormat("yy年MM月dd日 HH:mm:ss");
  27. short moneyformatCode=dataformat.getFormat("¥#,###");
  28. //创建日期格式对象
  29. CellStyle datecellstyle=workbook.createCellStyle();
  30. datecellstyle.setDataFormat(dateformatCode);
  31. //创建货币格式对象
  32. CellStyle moneycellstyle=workbook.createCellStyle();
  33. moneycellstyle.setDataFormat(moneyformatCode);;
  34. //创建列头
  35. Row headrow=sheet.createRow(0);
  36. Cell headcell0=headrow.createCell(0);
  37. headcell0.setCellValue("序号");
  38. Cell headcell1=headrow.createCell(1);
  39. headcell1.setCellValue("姓名");
  40. Cell headcell2=headrow.createCell(2);
  41. headcell2.setCellValue("日期");
  42. Cell headcell3=headrow.createCell(3);
  43. headcell3.setCellValue("红包金额");
  44. long begin=System.currentTimeMillis();
  45. for(int i=0;i<1000000;i++) {
  46. //String name=list.get(i);
  47. String name=i+"A";
  48. //创建行
  49. Row row=sheet.createRow(i+1);
  50. //创建单元格
  51. Cell cell0=row.createCell(0);//序号
  52. cell0.setCellValue(String.valueOf(i+1));
  53. Cell cell1=row.createCell(1);//姓名
  54. cell1.setCellValue(name);
  55. Cell cell2=row.createCell(2);//日期
  56. cell2.setCellStyle(datecellstyle);
  57. cell2.setCellValue(new Date());
  58. Cell cell3=row.createCell(3);//金额
  59. cell3.setCellStyle(moneycellstyle);
  60. cell3.setCellValue(Math.random()*1000000);
  61. }
  62. //写入文件
  63. workbook.write(out);
  64. long end=System.currentTimeMillis();
  65. System.out.println("耗时"+(end-begin)+"毫秒");
  66. } catch (IOException e) {
  67. e.printStackTrace();
  68. }
  69. }
  70. }

可以看到使用SXSSDWorkbook的执行时间为:

2.使用EasyExcel

(1)下载alibaba easyexcel相关jar包

(2) 订单实体类Order

  1. public class Order {
  2. @ExcelProperty("订单编号")
  3. private String orderId; // 订单编号
  4. @ExcelProperty("支付金额")
  5. @NumberFormat("¥#,###")
  6. private Double payment; // 支付金额
  7. @ExcelProperty(value = "创建日期",converter = LocalDateTimeConverter.class)
  8. private LocalDateTime creationTime; // 创建时间
  9. public Order() {
  10. this.orderId = LocalDateTime.now().format(DateTimeFormatter.ofPattern("yyyyMMddhhmmss"))
  11. + UUID.randomUUID().toString().substring(0, 5);
  12. this.payment = Math.random() * 10000;
  13. this.creationTime = LocalDateTime.now();
  14. }
  15. public String getOrderId() {
  16. return orderId;
  17. }
  18. public void setOrderId(String orderId) {
  19. this.orderId = orderId;
  20. }
  21. public Double getPayment() {
  22. return payment;
  23. }
  24. public void setPayment(Double payment) {
  25. this.payment = payment;
  26. }
  27. public LocalDateTime getCreationTime() {
  28. return creationTime;
  29. }
  30. public void setCreationTime(LocalDateTime creationTime) {
  31. this.creationTime = creationTime;
  32. }
  33. @Override
  34. public String toString() {
  35. return "Order [orderId=" + orderId + ", payment=" + payment + ", creationTime=" + creationTime + "]";
  36. }
  37. }

(3)Converter转换类(兼容LocalDateTime日期时间类)

  1. public class LocalDateTimeConverter implements Converter<LocalDateTime> {
  2. @Override
  3. public Class<LocalDateTime> supportJavaTypeKey() {
  4. return LocalDateTime.class;
  5. }
  6. @Override
  7. public CellDataTypeEnum supportExcelTypeKey() {
  8. return CellDataTypeEnum.STRING;
  9. }
  10. @Override
  11. public LocalDateTime convertToJavaData(CellData cellData, ExcelContentProperty contentProperty,
  12. GlobalConfiguration globalConfiguration) {
  13. return LocalDateTime.parse(cellData.getStringValue(), DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss"));
  14. }
  15. @Override
  16. public CellData<String> convertToExcelData(LocalDateTime value, ExcelContentProperty contentProperty,
  17. GlobalConfiguration globalConfiguration) {
  18. return new CellData<>(value.format(DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss")));
  19. }
  20. }

(4)写入100w条数据

  1. public class Demo {
  2. public static void main(String[] args) {
  3. // 写入100w
  4. EasyExcel.write("c:\\test\\run\\easy.xlsx", Order.class)
  5. .sheet("订单列表")
  6. .doWrite(data());
  7. }
  8. // 创建100w条订单数据
  9. private static List<Order> data() {
  10. List<Order> list = new ArrayList<Order>();
  11. for (int i = 0; i < 1000000; i++) {
  12. list.add(new Order());
  13. }
  14. return list;
  15. }
  16. }

(5)读取100w条数据

  1. EasyExcel.read("c:\\test\\run\\easy.xlsx", Order.class,new AnalysisEventListener<Order>() {
  2. @Override
  3. public void invoke(Order order, AnalysisContext arg1) {
  4. // 读取每条数据
  5. orderList.add(order);
  6. }
  7. @Override
  8. public void invokeHeadMap(Map<Integer, String> headMap, AnalysisContext context) {
  9. // 读取到列头
  10. System.out.println(headMap);
  11. }
  12. @Override
  13. public void doAfterAllAnalysed(AnalysisContext arg0) {
  14. // 读取完毕
  15. System.out.println("END");
  16. }
  17. }).sheet().doRead();

EasyExcel的执行时间为

可以看到两种方法时间相差不大,但在运行时,CPU的利用率还是有一定差距。

POI:

EasyExcel:

可以得出一个结论,在读写超大Excel文件时,我要使用EasyExcel。


总结

  1. Excel文件解析 apache POI,可以解析world和Excel
  2. getRow(),获取行 lastRoeNumber() 最后一个,getCell()按下标获取当前行的单元格
  3. GetStringCellValue() -->文本 getNumberCellValue() -->数字
  4. Workbook.createSheet() 创建表格
  5. CellStyle单元格格式
  6. Excel文件对象 Workbook workbook=new XSSFEorkbook()
  7. 创建工作簿 Sheet sheet1=workbook.createSheet();
  8. 按照工作簿下标获取Sheet Sheet sheet1=workbook.getSheetAt(0);
  9. 遍历所有行for(Row row:sheet){System.out.println(row);}
标签: eclipse java

本文转载自: https://blog.csdn.net/qq_45749511/article/details/125772181
版权归原作者 露棉 所有, 如有侵权,请联系我们删除。

“java中 Excel文件解析及超大Excel文件读写”的评论:

还没有评论