大数据 - overfit.cn

毕业设计：python租房数据分析可视化系统+爬虫+Flask框架大数据（附源码）✅

overfit同步小助手 2024-03-22 06:03:40 0 收藏

嬛嬛喊你学Spark、Scala的安装

目前，Spark生态系统已经发展成为一个包含多个子项目的集合，其中包含SparkSQL、Spark Streaming、GraphX、MLlib等子项目，Spark是基于内存计算的大数据并行计算框架。Spark得到了众多大数据公司的支持，这些公司包括Hortonworks、IBM、Intel、Clo

overfit同步小助手 2024-03-22 05:03:42 0 收藏

搭建Hadoop3.x完全分布式集群

本文详细介绍了Hadoop3完全分布式集群搭建的完整过程，主要包括：虚拟机安装、虚拟机克隆、网络环境配置、jdk安装、Hadoop安装、Hadoop配置参数、Hadoop服务的启动与关闭、常见问题及解决方法、示例演示等内容，并在文末提供了相关的百度网盘资源供下载。

overfit同步小助手 2024-03-22 03:03:45 0 收藏

总结Rabbitmq的六种模式

AMQP 一个提供统一消息服务的应用层标准高级消息队列协议，是应用层协议的一个开放标准，为面向消息的中间件设计。RabbitMQ是AMQP协议的Erlang的实现。概念说明连接Connection一个网络连接，比如TCP/IP套接字连接。信道Channel多路复用连接中的一条独立的双向数据流通道。为

overfit同步小助手 2024-03-22 03:03:38 0 收藏

本地idea连接Centos7kafka操作

搭建完kafka，一般都是使用本地来链接虚拟机的，初次链接会出现各种神奇的问题，特此记录一下。首先，请先对生产者，消费者，topic有一个大概的认识。

overfit同步小助手 2024-03-22 03:03:14 0 收藏

HIVE:分科求平均分

在这个实战中，我们使用了Hive框架来处理学生的月考成绩数据。首先，我们准备了三个文本文件，分别包含了语文、数学和英语的月考成绩数据。这些数据被上传到HDFS的指定目录。接着，我们启动了Hive Metastore服务，并通过Hive客户端连接到Hive。在Hive中，我们创建了一个分区表stude

overfit同步小助手 2024-03-22 02:03:41 0 收藏

Flink-1.18.1环境搭建

home/postgres/flink/flink/bin/config.sh:行32: 未预期的符号 `<' 附近有语法错误 /home/postgres/flink/flink/bin/config.sh:行32: ` done < <(find "$FLINK_LIB_DIR"!不要用sh命令

overfit同步小助手 2024-03-22 01:03:37 0 收藏

数据仓库——环境

数据仓库是一个面向主题的、集成的、非易失的、随时间变化的用来支持管理人员决策的数据集合。

overfit同步小助手 2024-03-22 00:03:44 0 收藏

重生之我在湖科职学Spark

重生之我在湖科职跟着宇将军学习Spark，好学，爱学，麦克阿瑟将军也说好!!!

overfit同步小助手 2024-03-21 22:03:37 0 收藏

Spark概述

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。现在形成一个高速发展应用广泛的生态系统。Spark 主要有三个特点 :首先，高级 API 剥离了对集群本身的关注，Spark 应用开发者可以专注于应用所要做的计算本身。其次，Spark 很快，支持交互式计算和复杂算法。最后，Sp

overfit同步小助手 2024-03-21 21:03:42 0 收藏

基于Python+大数据城市景观画像可视化系统设计和实现

# 背景意义：Python与大数据城市景观画像可视化的设计与实现随着城市化进程的不断加速，城市景观已经成为人们生活中不可或缺的一部分。城市景观反映了城市的文化底蕴、发展水平、生态环境等多方面特征，对城市形象的塑造和城市管理的提升具有至关重要的作用。同时，随着大数据技术的不断发展和普及，城市数据已经成

overfit同步小助手 2024-03-21 21:03:37 0 收藏

spark概述与scala的安装

Spark基于内存式计算的分布式的统一化的数据分析引擎。

overfit同步小助手 2024-03-21 21:03:31 0 收藏

Kafka安全模式之身份认证

SASL-PLAIN方式是一个经典的用户名/密码的认证方式，其中用户名和密码是以明文形式保存在服务端的JAAS配置文件中的，当客户端使用PLAIN模式进行认证时，密码是明文传输的，因此安全性较低，但好处是足够简单，方便我们对其进行二次开发，在0.10版本引入。在kafka身份认证的过程中，需要的pr

overfit同步小助手 2024-03-21 21:03:28 0 收藏

Python基于大数据的微博的舆情分析，微博评论情感分析可视化系统（V2.0），附源码，数据库

Python基于大数据的微博的舆情分析，微博评论情感分析可视化系统（V2.0），项目后端分爬虫模块、数据分析模块、数据存储模块、业务逻辑模块组成。功能包括登陆注册用户管理热门事件展示舆情分析，包括舆情分析，情感分类，用户分布，关键词云图，热门帖子，热门评论排名个人信息管理先后进行了数据获取和筛选存储

overfit同步小助手 2024-03-21 21:03:18 0 收藏

Kafka是如何保证消息不丢失

Apache Kafka通过多种机制来确保消息不丢失，包括数据复制（Replication）、持久化（Persistence）、确认机制（Acknowledgments）、幂等生产者（Idempotent Producer）、事务性发送（Transactional Messaging）等。以下是这些

overfit同步小助手 2024-03-21 20:03:56 0 收藏

Java八股文（RabbitMQ）

消息传递

overfit同步小助手 2024-03-21 20:03:37 0 收藏

大数据培训之Zookeeper零基础-1

在大数据中，几乎所有的框架，它的安装都提供了三种模式单机模式：在一台服务器上安装，往往能够启动这个框架的部分服务伪分布式：在一台服务器上安装，但是利用多个线程模式分布式环境，能够启动这个框架的大部分甚至于服务分布式：在集群上安装，能够启动这个框架的所有服务现阶段，先安装单机模式，搞定所有的概念之后，

overfit同步小助手 2024-03-21 19:03:36 0 收藏

Kafka消费者构建失败的解决方法

在使用Kafka时，有时候我们可能会遇到"Failed to construct Kafka consumer"（无法构建Kafka消费者）的错误。在Java项目中使用Kafka时，需要在项目的构建配置文件（如Maven或Gradle）中添加正确的Kafka依赖。请确保您的应用程序能够与Kafka集

overfit同步小助手 2024-03-21 17:03:44 0 收藏

Flink往Starrocks写数据报错：too many filtered rows

这个其实比较郁闷，你抛出的异常是过滤出太多行，与not null有什么关系呢？但是，当你把not null去掉后，发现很多too many filtered rows的bug都能解决了。这个时候你把最新的数据导入，可能会报上面的错。正当你以为你根据字面意思就知道bug的本质的时候，你会发现有些场景，

overfit同步小助手 2024-03-21 17:03:35 0 收藏

Flink 2.0 状态存算分离改造实践

本文整理自阿里云智能 Flink 存储引擎团队兰兆千在 FFA 2023 核心技术（一）中的分享，内容关于 Flink 2.0 状态存算分离改造实践的研究。

overfit同步小助手 2024-03-21 15:03:46 0 收藏