0


Java中解析Excel文件

    步入正题,我们在Java应用程序的开发过程中碰到Excel类型的文件时(*.xlsx),我们需要对其进行解析(导入)或生成(导出)。

    目前,在Java技术生态圈中,可以进行Excel文件处理的主流技术包括:

    Apache POI、JXL、Alibaba EasyExcel等。其中Apache POI基于DOM方式进行解析,将文件直接加载内存,所以速度较快,适合Excel文件数据量不大的应用场景;

    Alibaba EasyExcel采用逐行读取的解析模式,将每一行的解析结果以观察者的模式通知处理(AnalysisEventListener),所以比较适合数据体量较大的Excel文件解析;

    而对于JXL,它只支持Excel 2003以下版本,所以不太常用。

一、我们先来介绍:Apache POI是Apache软件基金会的开放源码函式库,是用Java编写的免费开源的跨平台的Java API,提供给Java程序对Microsoft Office格式档案读和写的功能;

    它分别提供对不同格式文件的解析:

    ● HSSF - 提供读写Microsoft Excel格式档案的功能。

    ● XSSF - 提供读写Microsoft Excel OOXML格式档案的功能。

    ● HWPF - 提供读写Microsoft Word格式档案的功能。

    ● HSLF - 提供读写Microsoft PowerPoint格式档案的功能。

    ● HDGF - 提供读写Microsoft Visio格式档案的功能。
     HSSF用于解析旧版本(*.xls)Excel文件,由于旧版本的Excel文件只能存在65535行数据,目前已经不常用,所以在这里我们将讨论-XSSF(*.xlsx)解析Excel文件:

    我们在使用时要先导入相关jar包到工程下的文件里:链接:https://pan.baidu.com/s/18SD0kQW0ey9ZyFDNUa2lJw 

提取码:z1y5

1.Workbook(Excel文件)

    创建或维护Excel工作簿的所有类的超接口:Workbook属于org.apache.poi.ss.usermodel包,

常见实现类是XSSFWorkbook

加载(解析)Excel文件

// 输入流
FileInputStream fis = new FileInputStream("c:\\test\\1627356554991.xlsx");

// Excel文件对象
Workbook workbook = new XSSFWorkbook(fis);

创建Excel文件

// 输出流
FileOutputStream fos = new FileOutputStream("c:\\test\\temp.xlsx");

// Excel文件对象
Workbook workbook = new XSSFWorkbook();

// 通过输出流进行写入
workbook.write(fos);

// 关闭资源
fos.close();
workbook.close();

2.Sheet (工作簿)

    通过Workbook来进行工作簿Sheet对象的获取或创建

获取工作簿

// 按照工作簿下标获取Sheet
Sheet sheet01 = workbook.getSheetAt(0);

// 按照工作簿名称获取Sheet
Sheet sheet02 = workbook.getSheet("Sheet0");

创建工作簿

// 按照默认名称创建工作簿
Sheet sheet1 = workbook.createSheet();

// 按照自定义名称创建工作簿
Sheet sheet2 = workbook.createSheet("自定义工作簿2");

获取工作簿的数量

int n = workbook.getNumberOfSheets();

3.Row(数据行)

    通过Sheet来进行数据行Row对象的获取或创建
//获取首行下标
int first = sheet.getFirstRowNum();
//获取尾行下标
int last = sheet.getLastRowNum();
//根据下标获取指定行
Row row = sheet.getRow(0);
//遍历所有行
for(Row row : sheet) {
    System.out.println(row);
}
//遍历指定区域行
for (int i = 1; i <= sheet.getLastRowNum(); i++) {
    Row row = sheet.getRow(i);
    System.out.println(row);
}

4.Cell(单元格)

    通过Row来进行单元格Cell对象的获取或创建
//创建单元格
Cell cell0 = row.createCell(0);
//设置单元格值
cell0.setCellValue(UUID.randomUUID().toString());
//根据下标获取单元格
Cell cell = row.getCell(1);
//遍历所有单元格
for(Cell cell : row) {
                
}
//获取单元格类型
CellType type = cell.getCellType();
//设置单元格样式
// 创建单元格样式
DataFormat dataFormat = workbook.createDataFormat();
Short formatCode = dataFormat.getFormat("yyyy-MM-dd HH:mm:ss");
CellStyle cellStyle = workbook.createCellStyle();
cellStyle.setDataFormat(formatCode);

// ...

// 为当前行创建单元格
Cell cell1 = row.createCell(1);
cell1.setCellStyle(cellStyle); // 设置单元格样式
cell1.setCellValue(new Date()); // 保存当前日期时间至本单元格

//设置单元格对齐
// 创建单元格样式
CellStyle cellStyle = workbook.createCellStyle();

//设置单元格的水平对齐类型。 此时水平居中
cellStyle.setAlignment(HorizontalAlignment.CENTER);

// 设置单元格的垂直对齐类型。 此时垂直靠底边
cellStyle.setVerticalAlignment(VerticalAlignment.BOTTOM);

二、超大Excel文件读写:

    **1、使用POI写入**:使用SXSSFWorkbook进行写入,通过设置SXXFWorkbook的构造参数,可以设置每次在内存中保持的行数,当达到这个值的时候,那么会把这些数据flush到磁盘上,这样就不会出现内存不够的情况。(注:这里用100w条数据进行测试,可以改成10w)
public class ExcelSTest7 {
    public static void main(String[] args) {
        
        try (
                Workbook workbook = new SXSSFWorkbook(100);
                FileOutputStream out = new FileOutputStream("C:\\Users\\文\\Desktop\\bbb5.xlsx");
                ) {
            
            Sheet sheet = workbook.createSheet();
            DataFormat dataFormat = workbook.createDataFormat();
            short dateFormatCode = dataFormat.getFormat("yyyy年mm月dd日 hh:mm:ss");
            short moneyFormatCode = dataFormat.getFormat("¥#,###");
            
            CellStyle dateCellStyle = workbook.createCellStyle();
            dateCellStyle.setDataFormat(dateFormatCode);
            
            CellStyle moneyCellStyle = workbook.createCellStyle();
            moneyCellStyle.setDataFormat(moneyFormatCode);
            
            for(int i = 0;i<1000000;i++) {
                String name = "A"+i;
                
                Row row = sheet.createRow(i);
                Cell cell0 = row.createCell(0);
                Cell cell1 = row.createCell(1);
                Cell cell2 = row.createCell(2);
                Cell cell3 = row.createCell(3);
                
                cell0.setCellValue(String.valueOf(i+1));
                
                cell1.setCellValue(name);
                
                cell2.setCellStyle(dateCellStyle);
                cell2.setCellValue(new Date());
                
                cell3.setCellStyle(moneyCellStyle);
                cell3.setCellValue((int)(Math.random()*100000));
            }
            workbook.write(out);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

}
    2、使用EasyExcel:下载相关alibabaeasyexcel相关jar包:链接:https://pan.baidu.com/s/1lh7RVun-m2i3UkTlV6Fvww 

提取码:zlvw

准备实体类

public class Order {
    @ExcelProperty("订单编号")
    private String orderId; // 订单编号
    
    @ExcelProperty("支付金额")
    @NumberFormat("¥#,###")
    private Double payment; // 支付金额
    
    @ExcelProperty(value = "创建日期",converter = LocalDateTimeConverter.class)
    private LocalDateTime creationTime; // 创建时间

    public Order() {
        this.orderId = LocalDateTime.now().format(DateTimeFormatter.ofPattern("yyyyMMddhhmmss"))
                + UUID.randomUUID().toString().substring(0, 5);
        this.payment = Math.random() * 10000;
        this.creationTime = LocalDateTime.now();
    }

    public String getOrderId() {
        return orderId;
    }

    public void setOrderId(String orderId) {
        this.orderId = orderId;
    }

    public Double getPayment() {
        return payment;
    }

    public void setPayment(Double payment) {
        this.payment = payment;
    }

    public LocalDateTime getCreationTime() {
        return creationTime;
    }

    public void setCreationTime(LocalDateTime creationTime) {
        this.creationTime = creationTime;
    }

    @Override
    public String toString() {
        return "Order [orderId=" + orderId + ", payment=" + payment + ", creationTime=" + creationTime + "]";
    }
}

准备Converter转换类(兼容LocalDateTime日期时间类)

public class LocalDateTimeConverter implements Converter<LocalDateTime> {

    @Override
    public Class<LocalDateTime> supportJavaTypeKey() {
        return LocalDateTime.class;
    }

    @Override
    public CellDataTypeEnum supportExcelTypeKey() {
        return CellDataTypeEnum.STRING;
    }

    @Override
    public LocalDateTime convertToJavaData(CellData cellData, ExcelContentProperty contentProperty,
            GlobalConfiguration globalConfiguration) {
        return LocalDateTime.parse(cellData.getStringValue(), DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss"));
    }

    @Override
    public CellData<String> convertToExcelData(LocalDateTime value, ExcelContentProperty contentProperty,
            GlobalConfiguration globalConfiguration) {
        return new CellData<>(value.format(DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss")));
    }

}

写入100w条数据

public class Demo {
    public static void main(String[] args) {
        // 写入100w
        EasyExcel.write("c:\\test\\run\\easy.xlsx", Order.class)
                 .sheet("订单列表")
                 .doWrite(data());
    }
    
    // 创建100w条订单数据
    private static List<Order> data() {
        List<Order> list = new ArrayList<Order>();
        for (int i = 0; i < 1000000; i++) {
            list.add(new Order());
        }
        return list;
    }
}

读取100w条数据

EasyExcel.read("c:\\test\\run\\easy.xlsx", Order.class,new AnalysisEventListener<Order>() {
    @Override
    public void invoke(Order order, AnalysisContext arg1) {
        // 读取每条数据
        orderList.add(order);
    }

    @Override
    public void invokeHeadMap(Map<Integer, String> headMap, AnalysisContext context) {
        // 读取到列头
        System.out.println(headMap);
    }

    @Override
    public void doAfterAllAnalysed(AnalysisContext arg0) {
        // 读取完毕
        System.out.println("END");
    }
}).sheet().doRead();

本文转载自: https://blog.csdn.net/qq_55897122/article/details/125770488
版权归原作者 以月光下洒 所有, 如有侵权,请联系我们删除。

“Java中解析Excel文件”的评论:

还没有评论