0


C++写入CSV的操作、混合类型数据写入CSV、写入大数据

1、C++写文件操作

在C++的实际开发中,输出CSV文件是非常常见的任务,特别是在需要将数据导出到表格或其他工具中进行分析时。CSV文件本质上是以逗号分隔的纯文本文件,因此可以使用标准的文件流(

std::ofstream

)来生成和写入CSV文件。

以下是常用的几种方法和技巧,帮助在C++开发中高效地输出CSV文件。

1. **使用

std::ofstream

直接写入 CSV 文件**

std::ofstream

是最常用的工具之一。可以使用它将数据写入文件,并以逗号分隔值。

示例代码:
#include<iostream>#include<fstream>#include<string>#include<vector>intmain(){// 打开 CSV 文件进行写入
    std::ofstream csv_file("output.csv");if(!csv_file.is_open()){
        std::cerr <<"无法打开文件"<< std::endl;return1;}// 写入 CSV 文件表头
    csv_file <<"Name, Age, Score"<< std::endl;// 一些示例数据
    std::vector<std::tuple<std::string,int,double>> data ={{"Alice",30,90.5},{"Bob",25,85.0},{"Charlie",22,78.2}};// 逐行写入数据for(constauto& row : data){
        csv_file << std::get<0>(row)<<","<< std::get<1>(row)<<","<< std::get<2>(row)<< std::endl;}// 关闭文件
    csv_file.close();

    std::cout <<"CSV 文件已生成。"<< std::endl;return0;}
说明:
  • std::ofstream 用于打开并写入文件。
  • 每行数据通过 , 分隔各个字段,最后使用 std::endl 进行换行。
  • 数据类型可以是任何类型,通常包括字符串、整数和浮点数。

2. 处理特殊字符 (逗号、引号等)

在实际开发中,CSV 文件中的数据有时会包含特殊字符,如逗号(

,

)、双引号(

"

)或换行符(

\n

)。这些特殊字符需要进行适当的处理,通常的方法是:

  • 用双引号包裹含有逗号或换行符的字段
  • 将字段中的双引号转义为两个双引号
示例代码:
#include<iostream>#include<fstream>#include<string>// 用双引号包裹字段,并处理内部的双引号
std::string escape_csv_field(const std::string& field){
    std::string result = field;if(field.find(',')!= std::string::npos || field.find('"')!= std::string::npos || field.find('\n')!= std::string::npos){
        result ="\""+ field +"\"";// 用双引号包裹字段}return result;}intmain(){
    std::ofstream csv_file("output_with_special_chars.csv");if(!csv_file.is_open()){
        std::cerr <<"无法打开文件"<< std::endl;return1;}// 写入包含逗号、引号等特殊字符的数据
    std::string name ="Alice \"the Great\"";
    std::string address ="123, Elm Street";// 处理特殊字符并写入 CSV
    csv_file <<escape_csv_field(name)<<","<<escape_csv_field(address)<< std::endl;

    csv_file.close();
    std::cout <<"CSV 文件已生成。"<< std::endl;return0;}
说明:
  • escape_csv_field 函数用于处理含有逗号、双引号或换行符的字段。
  • 如果字段中含有逗号或引号,则使用双引号将整个字段包裹起来,并将内部的双引号转义为 ""

3. 处理不同类型的数据

在导出CSV时,数据类型可能会包含整数、浮点数、字符串、自定义类型等。通过

std::ostringstream

结合

std::ofstream

,可以灵活控制输出格式。

示例:导出混合类型数据到 CSV
#include<iostream>#include<fstream>#include<sstream>#include<vector>#include<iomanip>// 用于设置精度structPerson{
    std::string name;int age;double score;// toStr函数用于格式化每个Person
    std::string toStr()const{
        std::ostringstream oss;
        oss << name <<","<< age <<","<< std::fixed << std::setprecision(2)<< score;return oss.str();}};intmain(){
    std::ofstream csv_file("mixed_data_output.csv");if(!csv_file.is_open()){
        std::cerr <<"无法打开文件"<< std::endl;return1;}// 写入表头
    csv_file <<"Name,Age,Score"<< std::endl;// 定义数据
    std::vector<Person> people ={{"Alice",30,95.567},{"Bob",25,85.123},{"Charlie",22,78.456}};// 写入每一行数据for(constauto& person : people){
        csv_file << person.toStr()<< std::endl;}

    csv_file.close();
    std::cout <<"CSV 文件已生成。"<< std::endl;return0;}
说明:
  • Person::toStr 函数用于格式化每个 Person 对象,将其转换为逗号分隔的字符串。
  • 通过 std::ostringstream 来设置浮点数的精度(std::setprecision(2))确保输出的浮点数保留两位小数。

4. 逐行写入大数据

当处理大量数据(例如数百万行数据)时,逐行写入可能会更有效,而不是一次性将所有数据放入内存中再输出。

std::ofstream

支持逐行写入数据,这可以降低内存的占用。

示例:逐行写入大数据集
#include<fstream>intmain(){
    std::ofstream csv_file("large_dataset_output.csv");if(!csv_file.is_open()){
        std::cerr <<"无法打开文件"<< std::endl;return1;}// 写入表头
    csv_file <<"ID,Value"<< std::endl;// 假设有大量数据需要写入for(int i =1; i <=1000000;++i){
        csv_file << i <<","<< i *1.2345<< std::endl;}

    csv_file.close();
    std::cout <<"大数据集 CSV 文件已生成。"<< std::endl;return0;}
说明:
  • 该示例演示了逐行写入大数据集的方式。通过逐行写入减少了对内存的需求,适合处理大规模数据。

5. 使用第三方库处理 CSV

虽然

std::ofstream

足以满足大多数 CSV 输出需求,但如果需要更高级的功能(如解析复杂的 CSV 文件、处理更多格式化需求),可以使用第三方库。

常用的第三方 CSV 库:
  1. **libcsv**:一个简单的 C 库,支持高效地读写 CSV 数据。
  2. **CSV for C++**:一个 C++ 的 CSV 解析和生成库,提供了更多的格式处理和容错功能。
  3. **rapidcsv**:C++17 的轻量级 CSV 读写库,支持读写 CSV 文件并与 STL 容器结合使用。

这些库提供了更加高级的功能,比如对 CSV 格式的严格解析、自动处理转义字符等,适合对 CSV 文件有更多需求的场景。


总结

在 C++ 中处理 CSV 文件输出的常用方法包括:

  1. 使用 std::ofstream 直接写入 CSV 文件,适用于大多数简单的 CSV 导出需求。
  2. 处理特殊字符(如逗号、引号、换行符),确保输出的 CSV 符合规范。
  3. 使用 std::ostringstream 处理复杂的格式化需求,特别是不同类型的数据格式化。
  4. 逐行写入大数据集,以减少内存占用。
  5. 对于更复杂的需求,可以考虑使用第三方库。

根据实际需求,可以选择不同的方法来处理 CSV 文件的输出。

2、写文件格式

在 C++ 中,文件写入的格式可以通过标准库的

std::ofstream

来实现。

std::ofstream

是用于文件输出操作的类,支持多种数据格式的写入。可以控制文件的写入模式、格式化输出(如浮点数精度、分隔符等),并根据需求选择不同的写入格式。

文件写入的基本格式

使用

std::ofstream

写文件的基本步骤如下:

  1. 包含必要的头文件:- #include <fstream>:用于文件输入输出。- #include <iostream>:用于标准输入输出(调试或打印错误信息)。- #include <sstream>:用于格式化输出时的字符串流操作。
  2. 打开文件:- 使用 std::ofstream 类创建文件输出流。- 可以指定文件的模式(覆盖模式、追加模式等)。
  3. 写入数据:- 使用流运算符(<<)将数据写入文件。- 控制数据格式,比如小数点位数、分隔符等。
  4. 关闭文件:- 通过 close() 关闭文件,确保数据被正确写入文件中。

示例:基本文件写入

#include<iostream>#include<fstream>intmain(){// 创建一个 ofstream 对象,并打开文件
    std::ofstream file("output.txt");// 检查文件是否成功打开if(!file.is_open()){
        std::cerr <<"无法打开文件"<< std::endl;return1;}// 向文件写入数据
    file <<"Hello, World!"<< std::endl;
    file <<"Writing to a file in C++."<< std::endl;// 关闭文件
    file.close();

    std::cout <<"数据已写入文件。"<< std::endl;return0;}

文件写入模式

std::ofstream

提供了几种常见的写入模式,控制文件的写入行为:

  1. 默认模式(覆盖模式):- std::ofstream file("filename.txt"):默认模式,覆盖已存在的文件内容。
  2. 追加模式(std::ios::app:- 在文件末尾追加数据,而不是覆盖原有的内容。std::ofstream file("output.txt", std::ios::app);
  3. 二进制模式(std::ios::binary:- 以二进制格式写入文件,适用于写入非文本数据(如图片、音频等)。std::ofstream file("output.bin", std::ios::binary);
  4. 同时追加和二进制模式:- 可以同时使用多个模式组合,如 std::ios::app | std::ios::binarystd::ofstream file("output.bin", std::ios::app | std::ios::binary);

控制输出格式

可以使用 C++ 的标准流库(如

std::ostringstream

)或直接使用

std::ofstream

的格式控制功能,来指定文件中的数据格式。

1. 浮点数格式化
#include<iostream>#include<fstream>#include<iomanip>// 用于设置格式控制intmain(){
    std::ofstream file("formatted_output.txt");if(!file.is_open()){
        std::cerr <<"无法打开文件"<< std::endl;return1;}// 设置浮点数格式为固定小数点,并保留2位小数
    file << std::fixed << std::setprecision(2);// 写入浮点数
    file <<"浮点数输出:"<<123.456789<< std::endl;

    file.close();return0;}
2. 控制字段宽度和填充
#include<iostream>#include<fstream>#include<iomanip>// 用于设置字段宽度和填充intmain(){
    std::ofstream file("formatted_output.txt");if(!file.is_open()){
        std::cerr <<"无法打开文件"<< std::endl;return1;}// 设置字段宽度和填充字符
    file << std::setw(10)<< std::setfill('*')<<"ID";
    file << std::setw(10)<<"Name"<< std::setw(10)<<"Score"<< std::endl;// 写入数据
    file << std::setw(10)<<1<< std::setw(10)<<"Alice"<< std::setw(10)<<95.6<< std::endl;
    file << std::setw(10)<<2<< std::setw(10)<<"Bob"<< std::setw(10)<<89.4<< std::endl;

    file.close();return0;}

说明

  • **std::setw(10)**:设置字段宽度为10个字符。
  • **std::setfill('*')**:使用 * 填充空白位置。
3. 处理 CSV 格式输出

如果需要输出 CSV 格式的数据,可以使用逗号(

,

)作为分隔符。结合上面的格式控制,可以轻松生成 CSV 文件。

#include<iostream>#include<fstream>intmain(){
    std::ofstream file("output.csv");if(!file.is_open()){
        std::cerr <<"无法打开文件"<< std::endl;return1;}// 写入 CSV 表头
    file <<"Name,Age,Score"<< std::endl;// 写入数据
    file <<"Alice,30,95.6"<< std::endl;
    file <<"Bob,25,89.4"<< std::endl;

    file.close();return0;}
4. 二进制格式输出

对于非文本数据(如图片、音频等),可以使用二进制模式写入文件:

#include<iostream>#include<fstream>intmain(){
    std::ofstream file("output.bin", std::ios::binary);if(!file.is_open()){
        std::cerr <<"无法打开文件"<< std::endl;return1;}int numbers[5]={1,2,3,4,5};// 写入二进制数据
    file.write(reinterpret_cast<char*>(numbers),sizeof(numbers));

    file.close();return0;}

说明

  • reinterpret_cast<char*>(numbers):将 int 数组转换为 char* 指针,便于以字节为单位写入。
  • sizeof(numbers):确定写入的数据大小。

总结

  • std::ofstream 是 C++ 中用于文件输出的主要工具,可以灵活控制输出格式。
  • 可以通过设置模式(如文本、二进制、追加等)控制文件写入方式。
  • 通过 iomanip 库,可以控制数据的输出格式,比如浮点数的精度、字段宽度、填充字符等。
  • 在输出 CSV 文件时,使用逗号作为分隔符,并注意对特殊字符(如引号、逗号)的处理。
  • 对于二进制文件,使用 write() 函数直接写入字节数据。

根据的具体需求,可以选择适合的格式控制方案来写入文件数据。

标签: c++ java 算法

本文转载自: https://blog.csdn.net/weixin_45864704/article/details/142112232
版权归原作者 破烂儿 所有, 如有侵权,请联系我们删除。

“C++写入CSV的操作、混合类型数据写入CSV、写入大数据”的评论:

还没有评论