大数据 - overfit.cn

【HBase入门】4. 常用 Shell 操作（1）

我们可以以shell的方式来维护和管理HBase。例如：执行建表语句、执行增删改查操作等等。

overfit同步小助手 2023-04-12 20:03:52 0 收藏

VMware在hadoop用户下创建hadoop

重新安装hadoop

overfit同步小助手 2023-04-12 19:04:08 0 收藏

Fabarta 正式加入大数据技术标准推进委员会，共同推动大数据技术标准化进程

Fabarta 正式加入中国通信标准化协会大数据技术标准推进委员会，将与其他成员单位共同推动大数据技术标准化进程，加速大数据技术在各行业的应用和发展，为社会和客户创造更大的价值。

overfit同步小助手 2023-04-12 19:04:05 0 收藏

hadoop的9870端口不能访问WEB界面的解决办法汇总

overfit同步小助手 2023-04-12 19:03:54 0 收藏

Hadoop学习（一）——环境配置(特别顺利版！！！已经排坑了)

Hadoop集群搭建，特别顺利版！！！！！软件：VM Wareiso 镜像：CentOS7Hadoop 版本：Hadoop-3.3.3。

overfit同步小助手 2023-04-12 19:03:47 0 收藏

RocksDB基本架构与原理介绍

RocksdbFlink提供基于流的有状态计算，除了提供实时数据流的处理能力，还需要将计算产生的状态存储起来。为了满足状态存取需求，提供了memory、flie system、rocksdb三种类型的状态存储机制。memory存取高效单空间有限，且可用性低；file system提供状态持久化能力但

overfit同步小助手 2023-04-12 19:03:40 0 收藏

canal-server使用

canal-server一直无法启动, 查看日志显示 admin:auth error原因: canal-server配置的参数, 账号密码使用错误(使用了canal-admin ui的登录账号和密码)部署的admin当天登录正常, 隔天登录后台就显示 network error原因: 使用启动ca

overfit同步小助手 2023-04-12 18:03:40 0 收藏

微服务学习-注册中心的搭建(Nacos、Eureka)

微服务学习-注册中心的搭建(Nacos、Eureka)，微服务架构风格是一种将单个应用程序开发为“一套小型服务”的方法，每个服务“运行在自己的进程中”，并通过轻量级机制(通常是HTTP资源API)进行通信。这些服务“围绕业务功能构建”，并通过全自动部署机制“独立部署”。“这些服务只有最低限度的集中管

overfit同步小助手 2023-04-12 17:04:09 0 收藏

【毕业设计】大数据B站用户数据情感分析系统 - python

🔥 Hi，大家好，这里是丹成学长的毕设系列文章！🔥 对毕设有任何疑问都可以问学长哦!这两年开始，各个学校对毕设的要求越来越高，难度也越来越大… 毕业设计耗费时间，耗费精力，甚至有些题目即使是专业的老师或者硕士生也需要很长时间，所以一旦发现问题，一定要提前准备，避免到后面措手不及，草草了事。为了

overfit同步小助手 2023-04-12 15:03:41 0 收藏

Flink：FlinkSql解析嵌套Json

flinksql解析嵌套json

overfit同步小助手 2023-04-12 13:03:42 0 收藏

kafka：java集成 kafka(springboot集成、客户端集成)

对于java的kafka集成，一般选用springboot集成kafka，但可能由于对接方kafka老旧、kafka不安全等问题导致kafak版本与spring版本不兼容，这个时候就得自己根据kafka客户端api集成了。

overfit同步小助手 2023-04-12 13:03:37 0 收藏

内网穿透实现在外远程连接RabbitMQ服务

RabbitMQ是一个在 AMQP(高级消息队列协议)基础上完成的，可复用的企业消息系统，是当前最主流的消息中间件之一。由erlang开发的AMQP（Advanced Message Queue 高级消息队列协议）的开源实现，由于erlang 语言的高并发特性，性能较好，本质是个队列，FIFO 先

overfit同步小助手 2023-04-12 12:04:25 0 收藏

【SQL开发实战技巧】系列（三十二）：数仓报表场景☞对表中某个字段内的值去重

现在有个问题：如何对表中某个字段内的值去重。这个问题，是日常开发中稍微常见的，同样也是一个比较困难的问题。如果仅是一个字符串的单行处理还好说，麻烦的就是对于有N(N>1)行数据的表处理（ORA-01436: 用户数据中的 CONNECT BY 循环）。在这篇文章之前，我曾经在第十二篇文章中提过此类问

overfit同步小助手 2023-04-12 12:04:22 0 收藏

PySpark之Python版本如何选择(详细版)

通过Python爬虫抓取Spark和Python的所有版本清单，然后选择PySpark对应的Python版本时，Python的版本清单中， **按照python版本排序之后** 距离Spark版本的发布时间最近的Python版本，基本就是该Spark版本需要的最新的Python版本了；另外Spar

overfit同步小助手 2023-04-12 11:03:45 0 收藏

Kafka学习篇1：Docker安装Kafka（单机默认参数版，依赖于Zookeeper）

单机版Kafka的Docker简易安装（Zookeeper模式）。注：本文仅适用于有Docker容器使用基础、Linux命令基础的编程人员，请确保Linux中已经安装了Docker。

overfit同步小助手 2023-04-12 11:03:38 0 收藏

【SQL开发实战技巧】系列（二十八）：数仓报表场景☞人员分布问题以及不同组(分区)同时聚集如何实现

本篇文章讲解的主要内容是：***通过行转列实现人员空间分布问题(工作显示为一列,每位员工显示一行)、连续行转列应该注意的问题、通过执行计划看对不同组、分区同时实现聚集需求：要求在员工表的明细数据里列出员工所在部门及职位的人数！！***【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作，毕竟S

overfit同步小助手 2023-04-12 10:04:14 0 收藏

内网穿透实现在外远程连接RabbitMQ服务

RabbitMQ是一个在 AMQP(高级消息队列协议)基础上完成的，可复用的企业消息系统，是当前最主流的消息中间件之一。

overfit同步小助手 2023-04-12 09:04:09 0 收藏

遗传算法(GA/NSGA)优化神经网络 GA-BP

GA-BP 算法。遗传算法(GA/NSGA)优化神经网络。基于 python3 pytorch 编写。利用GA寻找最优学习率和隐藏层神经元个数，加入池化操作进行优化。并尝试把GA运用在神经网络训练中，寻找最优神经网络权值。...

overfit同步小助手 2023-04-12 09:04:04 0 收藏

【SQL开发实战技巧】系列（二十九）：数仓报表场景☞简单的树形(分层)查询以及如何确定根节点、分支节点和叶子节点

本篇文章讲解的主要内容是：***第一个案例给大家介绍如何在Oracle中进行树形(分层)查询，主要介绍START WITH、CONNECT BY、PRIOR语法的使用。接着以如何确定根节点、分支节点和叶子节点的需求，给大家介绍level与connect_by_isleaf函数的使用。最后介绍节点路径

overfit同步小助手 2023-04-12 09:03:56 0 收藏

如何监控Kafka？他们的关键监测指标是什么

Kafka 是由 LinkedIn 开发一个分布式的基于发布订阅模式的消息队列，是一个实时数据处理系统，可以横向扩展。异步处理服务解耦流量削峰下图是异步处理的示例图。

overfit同步小助手 2023-04-12 09:03:49 0 收藏

【HBase入门】4. 常用 Shell 操作（1）

VMware在hadoop用户下创建hadoop

Fabarta 正式加入大数据技术标准推进委员会，共同推动大数据技术标准化进程

hadoop的9870端口不能访问WEB界面的解决办法汇总

Hadoop学习（一）——环境配置(特别顺利版！！！已经排坑了)

RocksDB基本架构与原理介绍

canal-server使用

微服务学习-注册中心的搭建(Nacos、Eureka)

【毕业设计】大数据B站用户数据情感分析系统 - python

Flink：FlinkSql解析嵌套Json

kafka：java集成 kafka(springboot集成、客户端集成)

内网穿透实现在外远程连接RabbitMQ服务

【SQL开发实战技巧】系列（三十二）：数仓报表场景☞对表中某个字段内的值去重

PySpark之Python版本如何选择(详细版)

Kafka学习篇1：Docker安装Kafka（单机默认参数版，依赖于Zookeeper）

【SQL开发实战技巧】系列（二十八）：数仓报表场景☞人员分布问题以及不同组(分区)同时聚集如何实现

内网穿透实现在外远程连接RabbitMQ服务

遗传算法(GA/NSGA)优化神经网络 GA-BP

【SQL开发实战技巧】系列（二十九）：数仓报表场景☞简单的树形(分层)查询以及如何确定根节点、分支节点和叶子节点

如何监控Kafka？他们的关键监测指标是什么

作者榜

资讯小助手

内容小助手

Deephub

奕凯