HBase基础编程

实验任务1:HBase表设计。通过HBase shell命令来设计并创建三张相关的表,其中后两张表可以关联起来,例如店铺与商品表。建议自拟表名和表内容。实验任务2:使用Java编程创建表和删除表,表名和列族自拟。

头歌大数据MapReduce基础运用

WordCount词频统计 HDFS文件读写 倒排索引 网页排序——PageRank算法 头歌

【手写数据库toadb】语言解析器,编程语言是这样被解析理解,解析器利器flex和bison,解析树与逆波兰式

在当今信息化时代,数据已经成为企业和个人最为宝贵的资产之一。为了有效地管理和利用这些数据,数据库技术应运而生,并得到了广泛的应用。目前市场上已经有很多成熟的数据库产品,如MySQL、Oracle、PostgreSQL等,它们提供了丰富的功能和性能,满足了不同场景的需求。然而,这些数据库产品的庞大和复

在Windows上安装Kibana - 大数据

请注意,为了使Kibana正常工作,您的系统应具备与Kibana兼容的Java Runtime Environment(JRE)版本。在解压缩的Kibana文件夹中,找到并打开"config"文件夹。在该文件夹中,您将找到一个名为"kibana.yml"的文件,它是Kibana的主要配置文件。在解压

FlinkSQL基本概念、时间属性和窗口

​ 在创建表的 DDL(CREATE TABLE 语句)中,可以增加一个字段,通过 WATERMARK语句来定义事件时间属性。WATERMARK 语句主要用来定义水位线(watermark)的生成表达式,这个表达式会将带有事件时间戳的字段标记为事件时间属性,并在它基础上给出水位线的延迟时间。​

Java必知必会系列:大数据处理与Hadoop

作者:禅与计算机程序设计艺术 1.简介Hadoop(简称HA),是一个分布式计算系统基础框架,由Apache基金会开发。它是一种可以用来存储大量数据的计算平台,可以实现海量数据的存储、分析、处理等功能。目前,Hadoop已成为最流行的大数据处理技术之一。Apac

Scala文件操作

Scala按行读取,Scala使用source.buffered方法按字符读取文件,Scala使用java.io.PrintWriter类,使用java.io.FileWriter类,使用java.io.FileOutputStream类, Scala序列化和反序列化

分布式集群——搭建Hadoop环境以及相关的Hadoop介绍

本文主要介绍hadoop的相关概念以及在Linux上面配置Hadoop的具体操作。镜像文件实际是存放的目录结构、文件属性等相关信息,是NameNode中关于 元数据的镜像。它是在NameNode启动时对整个文件系统的快照。edits:编辑日志文件,记录对文件或者目录的修改信息,比如删除目录,修改文件

分布式内存计算Spark环境部署与分布式内存计算Flink环境部署

Spark是一款分布式内存计算引擎,可以支撑海量数据的分布式计算。Spark在大数据体系是明星产品,作为最新一代的综合计算引擎,支持离线计算和实时计算。在大数据领域广泛应用,是目前世界上使用最多的大数据分布式计算引擎。我们将基于前面构建的Hadoop集群,部署Spark Standalone集群。

MEMORY存储引擎:MEMORY存储引擎是一个新的存储引擎,它的特点是数据全部存放在内存中,速度快,但是安全

作者:禅与计算机程序设计艺术 1.简介MEMORY简介MEMORY(Memory Oriented Database)存储引擎,中文名“内存式数据库”,是一种新型的存储引擎,其设计目标是能够在内存中快速访问和处理海量数据。该存储引擎是基于键值对存储的,其

Spark Streaming实战

作者:禅与计算机程序设计艺术 1.简介Apache Spark™作为世界上最流行的开源大数据计算框架之一,在近几年越来越受到大家的关注。基于Spark的分布式计算能力和速度的突飞猛进,使其成为许多企业应用中不可或缺的一环。但Spark本身所提供的高级特性如:SQ

Apache Zookeeper 快速入门 极客时间

作者:禅与计算机程序设计艺术 1.简介Apache Zookeeper 是一种分布式协调服务,它是一个基于 CP(一致性和容错)的系统,用来维护配置信息、命名数据、状态信息等;同时也提供分布式锁和 leader 选举等高可用功能。Zookeeper 的架构设计目

hive分位函数percentile和percentile_approx误区和解决方案

percentile和percentile_approx对分位数的计算

【大数据】HDFS客户端命令行(hdfs dfs)详细使用说明

Hadoop dfs 客户端命令ls/count/du/mv等使用详解

解锁安全高效办公——私有化部署的WorkPlus即时通讯软件

WorkPlus私有化部署的即时通讯软件不仅为企业提供了安全高效的沟通工具,还通过多重安全管控和个性化定制的功能,为企业打造了一个安全、高效、便捷的工作环境。在信息安全日益受到重视的今天,选择WorkPlus,让您的企业沟通更安心,工作更高效!为了满足企业对于安全沟通和高效办公的需求,我们隆重推出私

实战大数据项目

存储日志数据集(HDFS)数据仓库构建(Hive)数据分区表构建数据预处理 (Spark计算引擎)-使用Zeppelin进行写SQL订单指标分析Sqoop数据导出到传统数据库(Mysql)Superset数据可视化项目架构架构方案:1、基于Hadoop的HDFS(数据存储)文件系统来存储数据2、为

8-1HBase的安装与简单操作

delete删除指定对象的值(可以为表,行,列对应的值,另外也可以指定时间戳的值)先disable表,然后再drop表,最后重新create表。表名’, ‘行键’, ‘列族名:列名’, ‘列值’表名’, ‘行键’, ‘列族名’, ‘列值’表名’, ‘行键’, ‘列族名:列名’表名’, ‘行键’, ‘

RFID管理方案有效提升电力物资管理效率与资产安全

在电力行业,电力资产的管理是一项重要的任务,为了实现对电力资产的精细化管理、入出库监控管理、盘点管理和巡查管理等,电力公司多采用电力资产RFID管理系统,该系统能够实时监控出入库过程,有效防止出入库错误,并跟踪施工工具和安全工器具的领用情况,避免借用混乱的现象发生,通过实施该系统,电力公司提高变电所

git config查看设置配置

git config是Git版本控制系统中的一种命令,用于配置和管理Git的各种设置。

18、Flink的SQL 支持的操作和语法

20、Flink SQL之SQL Client: 不用编写代码就可以尝试 Flink SQL,可以直接提交 SQL 任务到集群上与所有 SQL 引擎一样,Flink 查询操作是在表上进行。与传统数据库不同,Flink 不在本地管理静态数据;相反,它的查询在外部表上连续运行。Flink 数据处理流水线

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈