【HBase入门】4. 常用 Shell 操作(1)

我们可以以shell的方式来维护和管理HBase。例如:执行建表语句、执行增删改查操作等等。

VMware在hadoop用户下创建hadoop

重新安装hadoop

Fabarta 正式加入大数据技术标准推进委员会,共同推动大数据技术标准化进程

Fabarta 正式加入中国通信标准化协会大数据技术标准推进委员会,将与其他成员单位共同推动大数据技术标准化进程,加速大数据技术在各行业的应用和发展,为社会和客户创造更大的价值。

hadoop的9870端口不能访问WEB界面的解决办法汇总

hadoop的9870端口不能访问WEB界面的解决办法汇总

Hadoop学习(一)——环境配置(特别顺利版!!!已经排坑了)

Hadoop集群搭建,特别顺利版!!!!!软件:VM Wareiso 镜像:CentOS7Hadoop 版本:Hadoop-3.3.3。

RocksDB基本架构与原理介绍

RocksdbFlink提供基于流的有状态计算,除了提供实时数据流的处理能力,还需要将计算产生的状态存储起来。为了满足状态存取需求,提供了memory、flie system、rocksdb三种类型的状态存储机制。memory存取高效单空间有限,且可用性低;file system提供状态持久化能力但

canal-server使用

canal-server一直无法启动, 查看日志显示 admin:auth error原因: canal-server配置的参数, 账号密码使用错误(使用了canal-admin ui的登录账号和密码)部署的admin当天登录正常, 隔天登录后台就显示 network error原因: 使用启动ca

微服务学习-注册中心的搭建(Nacos、Eureka)

微服务学习-注册中心的搭建(Nacos、Eureka),微服务架构风格是一种将单个应用程序开发为“一套小型服务”的方法,每个服务“运行在自己的进程中”,并通过轻量级机制(通常是HTTP资源API)进行通信。这些服务“围绕业务功能构建”,并通过全自动部署机制“独立部署”。“这些服务只有最低限度的集中管

【毕业设计】大数据B站用户数据情感分析系统 - python

🔥 Hi,大家好,这里是丹成学长的毕设系列文章!🔥 对毕设有任何疑问都可以问学长哦!这两年开始,各个学校对毕设的要求越来越高,难度也越来越大… 毕业设计耗费时间,耗费精力,甚至有些题目即使是专业的老师或者硕士生也需要很长时间,所以一旦发现问题,一定要提前准备,避免到后面措手不及,草草了事。为了

Flink:FlinkSql解析嵌套Json

flinksql解析嵌套json

kafka:java集成 kafka(springboot集成、客户端集成)

对于java的kafka集成,一般选用springboot集成kafka,但可能由于对接方kafka老旧、kafka不安全等问题导致kafak版本与spring版本不兼容,这个时候就得自己根据kafka客户端api集成了。

内网穿透实现在外远程连接RabbitMQ服务

RabbitMQ是一个在 AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。由erlang开发的AMQP(Advanced Message Queue 高级消息队列协议 )的开源实现,由于erlang 语言的高并发特性,性能较好,本质是个队列,FIFO 先

【SQL开发实战技巧】系列(三十二):数仓报表场景☞对表中某个字段内的值去重

现在有个问题:如何对表中某个字段内的值去重。这个问题,是日常开发中稍微常见的,同样也是一个比较困难的问题。如果仅是一个字符串的单行处理还好说,麻烦的就是对于有N(N>1)行数据的表处理(ORA-01436: 用户数据中的 CONNECT BY 循环)。在这篇文章之前,我曾经在第十二篇文章中提过此类问

PySpark之Python版本如何选择(详细版)

通过Python爬虫抓取Spark和Python的所有版本清单,然后选择PySpark对应的Python版本时,Python的版本清单中, **按照python版本排序之后** 距离Spark版本的发布时间最近的Python版本,基本就是该Spark版本需要的最新的Python版本了;另外Spar

Kafka学习篇1:Docker安装Kafka(单机默认参数版,依赖于Zookeeper)

单机版Kafka的Docker简易安装(Zookeeper模式)。注:本文仅适用于有Docker容器使用基础、Linux命令基础的编程人员,请确保Linux中已经安装了Docker。

【SQL开发实战技巧】系列(二十八):数仓报表场景☞人员分布问题以及不同组(分区)同时聚集如何实现

本篇文章讲解的主要内容是:***通过行转列实现人员空间分布问题(工作显示为一列,每位员工显示一行)、连续行转列应该注意的问题、通过执行计划看对不同组、分区同时实现聚集需求:要求在员工表的明细数据里列出员工所在部门及职位的人数!!***【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作,毕竟S

内网穿透实现在外远程连接RabbitMQ服务

RabbitMQ是一个在 AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。

遗传算法(GA/NSGA)优化神经网络 GA-BP

GA-BP 算法。遗传算法(GA/NSGA)优化神经网络。基于 python3 pytorch 编写。利用GA寻找最优学习率和隐藏层神经元个数,加入池化操作进行优化。并尝试把GA运用在神经网络训练中,寻找最优神经网络权值。...

【SQL开发实战技巧】系列(二十九):数仓报表场景☞简单的树形(分层)查询以及如何确定根节点、分支节点和叶子节点

本篇文章讲解的主要内容是:***第一个案例给大家介绍如何在Oracle中进行树形(分层)查询,主要介绍START WITH、CONNECT BY、PRIOR语法的使用。接着以如何确定根节点、分支节点和叶子节点的需求,给大家介绍level与connect_by_isleaf函数的使用。最后介绍节点路径

如何监控Kafka?他们的关键监测指标是什么

Kafka 是由 LinkedIn 开发一个分布式的基于发布订阅模式的消息队列,是一个实时数据处理系统,可以横向扩展。异步处理服务解耦流量削峰下图是异步处理的示例图。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈