0


HBase高手之路5—HBase的JavaAPI编程

文章目录

image-20230220084553544

Hbase高手之路5—Hbase的JavaAPI编程

一、需求与数据集

某某自来水公司,需要存储大量的缴费明细数据。以下截取了缴费明细的一部分内容。
用户ID姓名地址性别缴费时间表示数(本次)表示数(上次)用量(立方)金额查表日期最近缴费日期4944191张三石家庄市裕华区万达小区1-1-101男2023-3-23308.1283.1251502023-3-232023-2-1
因为缴费明细的数据记录非常庞大,该公司的信息部门决定使用HBase来存储这些数据。并且,他们希望能够通过Java程序来访问这些数据。

二、准备工作

1.下载安装Java

下载jdk1.8

在这里插入图片描述

环境变量配置

在这里插入图片描述

2.下载安装Idea

下载社区版本就可以了。

在这里插入图片描述
在这里插入图片描述

3.下载安装maven

在这里插入图片描述
在这里插入图片描述

4.Maven配置国内的镜像库

打开配置文件:
在这里插入图片描述

配置阿里云镜像:

在这里插入图片描述

5.Idea使用自定义的maven配置

关闭所有的项目,在Idea的启动页

在这里插入图片描述
在这里插入图片描述

6.创建一个maven测试项目

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

7.创建所需要的包

在这里插入图片描述
在这里插入图片描述

8.创建类文件,输入代码

快捷键

  • psvm:
  • publicstaticvoidmain(String[] args){}
  • sout:System.out.println();

image-20230323100527587

9.运行项目

点击运行项目:

image-20230323100657381

查看输出结果:

image-20230323100757597

三、创建HBase java api项目

在测试项目的基础上

1.修改pom文件,导入HBase的Java API的依赖包

     <dependencies>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-client</artifactId>
            <version>2.4.10</version>
        </dependency>
    </dependencies>

在这里插入图片描述

2.创建HBase的连接类

packagecn.edu.hgu.bigdata20;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.client.Admin;importorg.apache.hadoop.hbase.client.Connection;importorg.apache.hadoop.hbase.client.ConnectionFactory;importjava.io.IOException;publicclassHello{publicstaticvoidmain(String[] args){Configuration configuration =newConfiguration();try{Connection connection =ConnectionFactory.createConnection(configuration);//工厂模式Admin admin = connection.getAdmin();System.out.println(admin);}catch(IOException e){
            e.printStackTrace();}}}

image-20230327122111811

3.运行,查看结果

image-20230327082107569

四、案例一:使用HBase的Java API创建表

创建一个名为water_bill的表,包含一个列簇info

1.主要步骤

  • 定义表名,判断表是否存在
  • 表描述构建器,建立表描述对象
  • 列簇描述构建器,建立列簇描述对象
  • 表描述对象和列簇描述对象建立关系
  • 创建表

2.把hadoop的配置文件core-site.xml和HBase的配置文件hbase-site.xml复制到resources文件夹下,同时再添加一个日志文件log4j.properties

先导出到本地计算机

image-20230327090756995

image-20230327091014204

image-20230327122534835

复制到resources文件夹下

image-20230327122600156

3.编写代码

创建CreateTable类,编写代码

packagecn.edu.hgu.bigdata20;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.TableName;importorg.apache.hadoop.hbase.client.*;importorg.apache.hadoop.hbase.util.Bytes;importjava.io.IOException;/**
 * describe:创建表
 * author:王
 * date:2023/03/27
 */publicclassCreateTable{publicstaticvoidmain(String[] args){// 定义配置Configuration configuration =HBaseConfiguration.create();try{// 定义HBase连接Connection connection =ConnectionFactory.createConnection(configuration);//工厂模式// 定义Admin对象Admin admin = connection.getAdmin();System.out.println(admin);// 1.定义表名,判断表是否存在TableName tableName =TableName.valueOf("water_bill");// 2.表描述构建器TableDescriptorBuilder tableDescriptorBuilder =TableDescriptorBuilder.newBuilder(tableName);//构建器模式// 3.列簇描述构建器ColumnFamilyDescriptorBuilder columnFamilyDescriptorBuilder =ColumnFamilyDescriptorBuilder.newBuilder(Bytes.toBytes("info"));// 3.1 定义列簇描述构建器,建立列簇描述对象ColumnFamilyDescriptor columnFamilyDescriptor = columnFamilyDescriptorBuilder.build();// 4.表描述对象和列簇描述对象建立关系
            tableDescriptorBuilder.setColumnFamily(columnFamilyDescriptor);// 定义表描述对象TableDescriptor tableDescriptor = tableDescriptorBuilder.build();// 5.创建表
            admin.createTable(tableDescriptor);}catch(IOException e){
            e.printStackTrace();}}}

4.运行,查看结果

image-20230327094505500

5.在HBase的shell中查看创建的表名

image-20230327094619597

五、案例二:删除创建的表

删除刚刚创建的表

1.主要步骤

  • 定义表名,判断表是否存在
  • 如果表存在,禁用表
  • 删除表

2.创建类,编写代码

packagecn.edu.hgu.bigdata20;importjavafx.scene.control.Tab;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.TableName;importorg.apache.hadoop.hbase.client.Admin;importorg.apache.hadoop.hbase.client.Connection;importorg.apache.hadoop.hbase.client.ConnectionFactory;importjava.io.IOException;/**
 * describe:删除表
 * author:王
 * date:2023/03/27
 */publicclassDeleteTable{publicstaticvoidmain(String[] args)throwsIOException{// 1.创建hbase的配置Configuration configuration =HBaseConfiguration.create();// 2.创建hbase的连接Connection connection =null;Admin admin =null;try{//通过工厂模式,根据配置来创建连接
            connection =ConnectionFactory.createConnection(configuration);//System.out.println(connection);// 3.创建admin对象
            admin = connection.getAdmin();//System.out.println(admin);// 1.定义表名,判断表是否存在TableName tableName =TableName.valueOf("water_bill");// 2.如果存在,禁用表if(admin.tableExists(tableName)){//禁用表
                admin.disableTable(tableName);//3.删除表
                admin.deleteTable(tableName);}else{System.out.println("表不存在!");}}catch(IOException e){
            e.printStackTrace();}finally{
            admin.close();
            connection.close();}}}

六、代码优化

因为每种操作都需要admin对象,可以将其拿出来,作为一个单独的类。

1.创建一个获取admin的类

packagecn.edu.hgu.bigdata20;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.client.Admin;importorg.apache.hadoop.hbase.client.Connection;importorg.apache.hadoop.hbase.client.ConnectionFactory;importjava.io.IOException;/**
 * describe:获取admin对象
 * author:王
 * date:2023/03/27
 */publicclassGetAdmin{publicstaticAdmingetAdmin()throwsIOException{// 1.创建hbase的配置Configuration configuration =HBaseConfiguration.create();// 2.创建hbase的连接//通过工厂模式,根据配置来创建连接Connection connection =ConnectionFactory.createConnection(configuration);// 3.创建admin对象Admin admin = connection.getAdmin();// 4.返回创建的admin对象return admin;}}

image-20230327124957729

2.修改删除表的类的代码

packagecn.edu.hgu.bigdata20;importorg.apache.hadoop.hbase.TableName;importorg.apache.hadoop.hbase.client.Admin;importjava.io.IOException;/**
 * describe:删除表
 * author:王
 * date:2023/03/27
 */publicclassDeleteTable{publicstaticvoidmain(String[] args)throwsIOException{// 通过静态类方法创建admin对象Admin admin =GetAdmin.getAdmin();// 1.定义表名,判断表是否存在TableName tableName =TableName.valueOf("water_bill");// 2.如果存在,禁用表if(admin.tableExists(tableName)){//禁用表
            admin.disableTable(tableName);//3.删除表
            admin.deleteTable(tableName);}else{System.out.println("表不存在!");}}}

image-20230327125311032

3.运行,查看结果

image-20230327125446943

image-20230327125538651

七、代码继续优化

1.创建一个主类,把前面的类的功能写成对应的方法

image-20230330095827480

image-20230330095942011

image-20230330100344629

image-20230330100038098

代码如下:

packagecn.edu.hgu.bigdata20;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.TableName;importorg.apache.hadoop.hbase.client.*;importorg.apache.hadoop.hbase.util.Bytes;importjava.io.IOException;/**
 * describe:实现Hbase的增删改查
 * author:王
 * date:2023/3/30
 */publicclassHBaseCRUD{// 主方法publicstaticvoidmain(String[] args)throwsIOException{//创建表water_bill444createTable("water_bill444","info");//删除表deleteTable("water_bill444");}/**
     * 获取admin
     */publicstaticAdmingetAdmin()throwsIOException{// 1.创建hbase的配置Configuration configuration =HBaseConfiguration.create();// 2.创建hbase的连接//通过工厂模式,根据配置来创建连接Connection connection =ConnectionFactory.createConnection(configuration);// 3.创建admin对象Admin admin = connection.getAdmin();// 4.返回创建的admin对象return admin;}/**
     * 创建表
     *
     * @return
     */publicstaticbooleancreateTable(String tableName,String columnFamily)throwsIOException{Admin admin =getAdmin();// 1.定义表名,判断表是否存在TableName table =TableName.valueOf(tableName);if(!admin.tableExists(table)){// 2.表描述构建器TableDescriptorBuilder tableDescriptorBuilder =TableDescriptorBuilder.newBuilder(table);//构建器模式// 3.列簇描述构建器ColumnFamilyDescriptorBuilder columnFamilyDescriptorBuilder =ColumnFamilyDescriptorBuilder.newBuilder(Bytes.toBytes(columnFamily));// 3.1 定义列簇描述构建器,建立列簇描述对象ColumnFamilyDescriptor columnFamilyDescriptor = columnFamilyDescriptorBuilder.build();// 4.表描述对象和列簇描述对象建立关系
            tableDescriptorBuilder.setColumnFamily(columnFamilyDescriptor);// 5.定义表描述对象TableDescriptor tableDescriptor = tableDescriptorBuilder.build();// 6.创建表
            admin.createTable(tableDescriptor);returntrue;}else{returnfalse;}}/**
     * 删除表
     */publicstaticbooleandeleteTable(String tableName)throwsIOException{// 通过静态类方法创建admin对象Admin admin =GetAdmin.getAdmin();// 1.定义表名,判断表是否存在TableName table =TableName.valueOf(tableName);// 2.如果存在,禁用表if(admin.tableExists(table)){//禁用表
            admin.disableTable(table);//3.删除表
            admin.deleteTable(table);}else{returnfalse;}returntrue;}/**
     * 插入数据
     */publicstaticbooleaninsertData(){returntrue;}}

2.main调用相应的方法实现操作

2.1 创建表

image-20230330100132175

image-20230330100446519

image-20230330100514507

2.2 删除表

image-20230330100735971

image-20230330100759836

2.3 进一步优化代码

我们发现创建表和删除表方法中的admin是重复调用的,感觉比较浪费资源,我们可以先对使用初始化方法,初始化admin,其他的方法只需要调用这个静态变量就可以了,而不是调用getAdmin方法。

image-20230330101217733

image-20230330101542949

image-20230330101526498

代码如下:

packagecn.edu.hgu.bigdata20;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.TableName;importorg.apache.hadoop.hbase.client.*;importorg.apache.hadoop.hbase.util.Bytes;importjava.io.IOException;/**
 * describe:实现Hbase的增删改查
 * author:王
 * date:2023/3/30
 */publicclassHBaseCRUD{//定义admin对象publicstaticAdmin admin =null;// 主方法publicstaticvoidmain(String[] args)throwsIOException{init();//创建表water_bill444createTable("water_bill444","info");//删除表deleteTable("water_bill444");}/**
     * 初始化admin
     *
     * @throws IOException
     */publicstaticvoidinit()throwsIOException{
        admin =getAdmin();}/**
     * 获取admin
     */publicstaticAdmingetAdmin()throwsIOException{// 1.创建hbase的配置Configuration configuration =HBaseConfiguration.create();// 2.创建hbase的连接//通过工厂模式,根据配置来创建连接Connection connection =ConnectionFactory.createConnection(configuration);// 3.创建admin对象Admin admin = connection.getAdmin();// 4.返回创建的admin对象return admin;}/**
     * 创建表
     *
     * @param tableName
     * @param columnFamily
     * @return
     * @throws IOException
     */publicstaticbooleancreateTable(String tableName,String columnFamily)throwsIOException{//Admin admin = getAdmin();// 1.定义表名,判断表是否存在TableName table =TableName.valueOf(tableName);if(!admin.tableExists(table)){// 2.表描述构建器TableDescriptorBuilder tableDescriptorBuilder =TableDescriptorBuilder.newBuilder(table);//构建器模式// 3.列簇描述构建器ColumnFamilyDescriptorBuilder columnFamilyDescriptorBuilder =ColumnFamilyDescriptorBuilder.newBuilder(Bytes.toBytes(columnFamily));// 3.1 定义列簇描述构建器,建立列簇描述对象ColumnFamilyDescriptor columnFamilyDescriptor = columnFamilyDescriptorBuilder.build();// 4.表描述对象和列簇描述对象建立关系
            tableDescriptorBuilder.setColumnFamily(columnFamilyDescriptor);// 5.定义表描述对象TableDescriptor tableDescriptor = tableDescriptorBuilder.build();// 6.创建表
            admin.createTable(tableDescriptor);returntrue;}else{returnfalse;}}/**
     * 删除表
     *
     * @param tableName
     * @return
     * @throws IOException
     */publicstaticbooleandeleteTable(String tableName)throwsIOException{// 通过静态类方法创建admin对象//Admin admin = GetAdmin.getAdmin();// 1.定义表名,判断表是否存在TableName table =TableName.valueOf(tableName);// 2.如果存在,禁用表if(admin.tableExists(table)){//禁用表
            admin.disableTable(table);//3.删除表
            admin.deleteTable(table);}else{returnfalse;}returntrue;}/**
     * 插入数据
     */publicstaticbooleaninsertData(){returntrue;}}

八、案例三:往创建的表中插入数据

往water_bill中插入数据

1.主要步骤

  • 使用hbase的连接获取表对象
  • 构建rowkey、列簇名、列名、值
  • 构建Put对象(对应shell中的put命令)
  • 添加某列(列簇、列名、值)
  • 表对象执行put操作
  • 关闭表对象

2.创建方法,编写代码

image-20230405100251157

3.在main中调用插入数据的方法

image-20230405100326621

4.执行,查看结果

image-20230405100348320

5.作业:插入其他列的数据

在前面,我们只插入了3列数据,下面我们插入其他列的数据:

image-20230405102748477

image-20230405102728468

6.完整代码

packagecn.edu.hgu.bigdata20;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.TableName;importorg.apache.hadoop.hbase.client.*;importorg.apache.hadoop.hbase.util.Bytes;importjava.io.IOException;/**
 * describe:实现Hbase的增删改查
 * author:王
 * date:2023/3/30
 */publicclassHBaseCRUD{//定义admin对象publicstaticAdmin admin =null;// 定义connection对象publicstaticConnection connection =null;// 主方法publicstaticvoidmain(String[] args)throwsIOException{init();//创建表water_bill444// createTable("water_bill444", "info");// createTable("water_bill333", "info");//删除表//deleteTable("water_bill444");// 插入数据//insertData("water_bill333", "10000001", "info", "username", "zhangsan");//插入姓名//insertData("water_bill333", "10000001", "info", "sex", "男");//插入性别//insertData("water_bill333", "10000001", "info", "money", String.valueOf(150));//插入金额insertData("water_bill333","10000001","info","payment_date","2023-3-23");//插入缴费时间insertData("water_bill333","10000001","info","last_payment_date","2023-2-1");//插入最近缴费日期insertData("water_bill333","10000001","info","table_lookup_date","2023-3-23");//插入查表日期insertData("water_bill333","10000001","info","address","石家庄市裕华区万达小区1-1-101");//插入地址insertData("water_bill333","10000001","info","representation_number",String.valueOf(308.1));//插入表示数(本次)insertData("water_bill333","10000001","info","last_representation_number",String.valueOf(283.1));//插入表示数(上次)insertData("water_bill333","10000001","info","dosage",String.valueOf(25));//插入用量(立方)}/**
     * 初始化admin
     *
     * @throws IOException
     */publicstaticvoidinit()throwsIOException{//admin = getAdmin();// 1.创建hbase的配置Configuration configuration =HBaseConfiguration.create();// 2.创建hbase的连接//通过工厂模式,根据配置来创建连接
        connection =ConnectionFactory.createConnection(configuration);// 3.创建admin对象
        admin = connection.getAdmin();// 4.返回创建的admin对象// return admin;}/**
     * 获取admin
     */publicstaticAdmingetAdmin()throwsIOException{// 1.创建hbase的配置Configuration configuration =HBaseConfiguration.create();// 2.创建hbase的连接//通过工厂模式,根据配置来创建连接Connection connection =ConnectionFactory.createConnection(configuration);// 3.创建admin对象Admin admin = connection.getAdmin();// 4.返回创建的admin对象return admin;}/**
     * 创建表
     *
     * @param tableName
     * @param columnFamily
     * @return
     * @throws IOException
     */publicstaticbooleancreateTable(String tableName,String columnFamily)throwsIOException{//Admin admin = getAdmin();// 1.定义表名,判断表是否存在TableName table =TableName.valueOf(tableName);if(!admin.tableExists(table)){// 2.表描述构建器TableDescriptorBuilder tableDescriptorBuilder =TableDescriptorBuilder.newBuilder(table);//构建器模式// 3.列簇描述构建器ColumnFamilyDescriptorBuilder columnFamilyDescriptorBuilder =ColumnFamilyDescriptorBuilder.newBuilder(Bytes.toBytes(columnFamily));// 3.1 定义列簇描述构建器,建立列簇描述对象ColumnFamilyDescriptor columnFamilyDescriptor = columnFamilyDescriptorBuilder.build();// 4.表描述对象和列簇描述对象建立关系
            tableDescriptorBuilder.setColumnFamily(columnFamilyDescriptor);// 5.定义表描述对象TableDescriptor tableDescriptor = tableDescriptorBuilder.build();// 6.创建表
            admin.createTable(tableDescriptor);returntrue;}else{returnfalse;}}/**
     * 删除表
     *
     * @param tableName
     * @return
     * @throws IOException
     */publicstaticbooleandeleteTable(String tableName)throwsIOException{// 通过静态类方法创建admin对象//Admin admin = GetAdmin.getAdmin();// 1.定义表名,判断表是否存在TableName table =TableName.valueOf(tableName);// 2.如果存在,禁用表if(admin.tableExists(table)){//禁用表
            admin.disableTable(table);//3.删除表
            admin.deleteTable(table);}else{returnfalse;}returntrue;}/**
     * @param tableName
     * @param rowkey
     * @param columnFamily
     * @param column
     * @param value
     * @return
     * @throws IOException
     * @describe 插入数据
     */publicstaticbooleaninsertData(String tableName,String rowkey,String columnFamily,String column,String value)throwsIOException{// 1.使用Hbase的连接获取表对象Table table = connection.getTable(TableName.valueOf(tableName));// 2.构建rowkey、列粗名、列名、值// 3.构建Put对象(对应shell中的Put命令)Put put =newPut(Bytes.toBytes(rowkey));// 4.添加某列(列簇名、列名、值)
        put.addColumn(Bytes.toBytes(columnFamily),Bytes.toBytes(column),Bytes.toBytes(value));// 5.表对象实现put操作
        table.put(put);// 6.关闭表对象
        table.close();returntrue;}}

九、案例四:获取数据

1.获取某一列的数据

1)获取某一列的数据

image-20230405103759708

2)在main中调用用并执行,查看结果

image-20230405104137881

image-20230405104152665

2.获取一行数据

image-20230405105554816

image-20230405105614039

image-20230405110139505

3.代码

publicstaticvoidgetOne(String tableName,String rowkey)throwsIOException{// 1.使用Hbase的连接获取表对象Table table = connection.getTable(TableName.valueOf(tableName));// 2.构建Get对象(对应shell中的get命令)Get get =newGet(Bytes.toBytes(rowkey));// 3.表对象执行get命令得到ResultResult result = table.get(get);// 4.获取一行数据//        byte[] row = result.getRow();//        for (byte b : row) {//            System.out.println(Bytes.toBytes(b));//        }List<Cell> cells = result.listCells();for(Cell cell : cells){System.out.print(Bytes.toString(cell.getQualifierArray(), cell.getQualifierOffset(), cell.getQualifierLength()));System.out.println("=>"+Bytes.toString(cell.getValueArray(), cell.getValueOffset(), cell.getValueLength()));}// 5.关闭表对象
        table.close();

十、案例五:删除数据

image-20230405110659161

执行并查看结果

image-20230405111627207

image-20230405111642355

image-20230405111657063

十一、案例六:导入大量的数据

1.需求

有一份10w条记录的抄表数据文件

image-20230405111819409

2.导入数据到HBase表中

在HBase中,有一个import的MapReduce方法,可以专门用来将数据导入HBase表中。

使用命令:

hbase org.apache.hadoop.hbase.mapreduce.Import 表名 hdfs数据文件路径

3.上传数据文件到hdfs上

新建文件夹:

image-20230405112456419

上传文件到hadoop集群:

image-20230405112757725

web ui查看

image-20230405112839552

4.创建表

image-20230405113126885

image-20230405113158809

5.启动yarn

image-20230405113238941

6.运行导入命令

hbase org.apache.hadoop.hbase.mapreduce.Import WATER_BILL /water_bill

image-20230405113631945

image-20230405113731866

执行成功:

image-20230405113806505

7.查看数据

scan "WATER_BILL",{FORMATTER=>'toString',LIMIT=>2}

image-20230405114013719

8.count计数

count "WATER_BILL"

image-20230405114243103

image-20230405114511344

9.mapreduce 计数

hbase org.apache.hadoop.hbase.mapreduce.RowCounter 'WATER_BILL'

image-20230405114645587

image-20230405114658806

十二、案例七:查询2020年6月份所有的用户的用水量

1.需求分析

在HBase中使用scan+filter实现数据的过滤查询。2020年6月份其实就是从2020年6月1号到2020年6月30号的所有的超标数据中的用水量

实现步骤:

  1. 获取表
  2. 构建scan请求对象
  3. 构建两个过滤器 - a) 构建两个日期范围过滤器(注意此处请使用RECORD_DATE——抄表日期比较- b) 构建过滤器列表
  4. 执行scan扫描请求
  5. 迭代打印result
  6. 迭代单元格列表
  7. 关闭ResultScanner(这玩意把转换成一个个的类似get的操作,注意要关闭释放资源)
  8. 关闭表

2.编写代码

image-20230410091641598

image-20230410091656783

/**
     * 查询数据
     *
     * @param tableName
     * @param family
     * @param column
     * @param startValue
     * @param endValue
     * @return
     * @throws IOException
     */publicstaticbooleanqueryData(String tableName,String family,String column,String startValue,String endValue)throwsIOException{// 1.使用Hbase的连接获取表对象Table table = connection.getTable(TableName.valueOf(tableName));// 2.创建Scan对象Scan scan =newScan();// 3.创建两个过滤器// 3.1 创建开始日期过滤器SingleColumnValueFilter startDateFilter =newSingleColumnValueFilter(Bytes.toBytes(family),Bytes.toBytes(column),CompareOperator.GREATER_OR_EQUAL,Bytes.toBytes(startValue));// 3.2 创建结束日期过滤器SingleColumnValueFilter endDateFilter =newSingleColumnValueFilter(Bytes.toBytes(family),Bytes.toBytes(column),CompareOperator.LESS_OR_EQUAL,Bytes.toBytes(endValue));// 3.3 创建过滤器列表FilterList filterList =newFilterList(FilterList.Operator.MUST_PASS_ALL, startDateFilter, endDateFilter);// 4.构建扫描器
        scan.setFilter(filterList);// 5.执行扫描操作ResultScanner resultScanner = table.getScanner(scan);// 6.迭代打印resultfor(Result result : resultScanner){// 打印rowkeySystem.out.println("rowkey=>"+Bytes.toString(result.getRow()));// 迭代打印单元格列表List<Cell> cells = result.listCells();for(Cell cell : cells){// 打印列簇及列名System.out.print(Bytes.toString(cell.getQualifierArray(), cell.getQualifierOffset(), cell.getQualifierLength()));// 打印值System.out.println("=>"+Bytes.toString(cell.getValueArray(), cell.getValueOffset(), cell.getValueLength()));}}// 7.关闭资源
        resultScanner.close();
        table.close();returntrue;}

3.在main中调用方法

image-20230410094847649

queryData("WATER_BILL","C1","RECORD_DATE","2020-06-01","2020-06-30");

4.执行,查看结果

image-20230410095039830

5.用量及金额乱码,需要对代码进行改进

解决数值型数据的显示乱码问题,在HBase中,如果是字符串数据,则可以正常显示,但是如果HBase存储的是int、double、float等数值型数据时,显示就会乱码,解决的方法就是判断是否是数值型数据,如果是则进行相应的转换

image-20230410095151918

String colName =Bytes.toString(cell.getQualifierArray(), cell.getQualifierOffset(), cell.getQualifierLength());System.out.print(colName);if(colName.equals("NUM_CURRENT")|| colName.equals("NUM_PREVIOUS")|| colName.equals("NUM_USAGE")|| colName.equals("TOTAL_MONEY")){System.out.println(" => "+Bytes.toDouble(cell.getValueArray(), cell.getValueOffset()));}else{System.out.println(" => "+Bytes.toString(cell.getValueArray(), cell.getValueOffset(), cell.getValueLength()));}

重新执行,查看结果

image-20230410095323137

十三、案例八:导出数据

Export Job

用法:

hbase org.apache.hdoop.hbase.mapreduce.Export 表名 hdfs路径

执行命令:

hbase org.apache.hadoop.hbase.mapreduce.Export WATER_BILL /output/water_bill

image-20230410095543038

image-20230410095557886

在web ui 上查看:

image-20230410095645983

标签: hbase java 数据库

本文转载自: https://blog.csdn.net/W_chuanqi/article/details/130055800
版权归原作者 W_chuanqi 所有, 如有侵权,请联系我们删除。

“HBase高手之路5—HBase的JavaAPI编程”的评论:

还没有评论