大数据 - overfit.cn

Spark之【基础介绍】

Spark是当今大数据领域最活跃、最热门、最高效的大数据通用计算平台之一。

overfit同步小助手 2024-03-12 11:03:25 0 收藏

Cloud-Eureka服务治理-Ribbon负载均衡

INSERT INTO `tb_user`(`id`, `username`, `address`) VALUES (1, '柳岩', '湖南省衡阳市');INSERT INTO `tb_user`(`id`, `username`, `address`) VALUES (4, '张必沉', '天津

overfit同步小助手 2024-03-12 10:03:51 0 收藏

Zookeeper(3)

ZAB协议-----崩溃恢复

overfit同步小助手 2024-03-12 10:03:26 0 收藏

大数据处理：利用Spark进行大规模数据处理

1.背景介绍大数据处理是指对大规模、高速、多源、多样化的数据进行处理、分析和挖掘的过程。随着互联网、人工智能、物联网等领域的发展，大数据处理技术已经成为当今科技的核心技术之一。Apache Spark是一个开源的大数据处理框架，它可以处理批量数据和流式数据，并提供了一系列的数据处理和分析功能。本文将

overfit同步小助手 2024-03-12 09:03:45 0 收藏

2024 年中国高校大数据挑战赛第二场 C题：用户对博物馆评论的情感分析思路+python代码

问题 1：针对每位用户的评论，建立情感判别模型，判断评论内容的情感正反方向，输出评论内容的情感方向为正面、中立、负面，并统计每个博物馆历史评论各个方向情感的比例分布情况。符合等等影响情感方向的指标，建立情感得分评价模型，得到每位用户评论的情感得分，并基于得分对五个博物馆进行客观排名。挖出来的，不

overfit同步小助手 2024-03-12 07:03:35 0 收藏

Cloud整合Zookeeper代替Eureka

Zookeeper是一个分布式协调工具,可以实现注册中心功能。

overfit同步小助手 2024-03-12 07:03:32 0 收藏

kyuubi整合spark on yarn

overfit同步小助手 2024-03-12 06:03:48 0 收藏

Hive基础

本篇博客参考线上教程的笔记，对Hive数据仓库的基础进行简单总结，以便加深理解和记忆

overfit同步小助手 2024-03-12 05:03:54 0 收藏

配置spark on hive，后续可以使用DataGrip连接spark编写sparkSQL

使用DataGrip连接spark编写sparkSQL

overfit同步小助手 2024-03-12 05:03:42 0 收藏

RabbitMQ 安装使用

overfit同步小助手 2024-03-12 05:03:38 0 收藏

HiveSQL题——炸裂函数(explode/posexplode)

overfit同步小助手 2024-03-12 05:03:35 0 收藏

python毕设选题 - 大数据房价预测分析与可视

🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是🚩大数据房价预测分析与可视🥇学长这里给一个

overfit同步小助手 2024-03-12 04:03:49 0 收藏

Hive入门，Hive是什么？

overfit同步小助手 2024-03-12 04:03:20 0 收藏

【ELK日志分析系统】Zookeeper、Kafka集群与Filebeat+Kafaka+ELK架构

Zookeeper、Kafka集群与Filebeat+Kafaka+ELK架构

overfit同步小助手 2024-03-12 01:03:34 0 收藏

数据挖掘（Data Mining）第一章课后习题

overfit同步小助手 2024-03-12 00:03:48 0 收藏

2.9日学习打卡----初学RabbitMQ（四）

在MQ中，当消息成为死信（Dead message）后，消息中间件可以将其从当前队列发送到另一个队列中，这个队列就是死信队列。而在RabbitMQ中，由于有交换机的概念，实际是将死信发送给了死信交换机（Dead Letter Exchange，简称DLX）。死信交换机和死信队列和普通的没有区别。消息

overfit同步小助手 2024-03-12 00:03:45 0 收藏

DeepBI实现AI结合数据仓库做智能数据分析VS传统BI工具

辛辛苦苦做数据分析准备，费劲巴拉做出可视化图表，还得考验我们编写报告的能力，这就是传统BI。传统数据分析如同一座巍峨的大山，每一步都让人感到沉重和艰难。接下来展示新时代的数据分析软件-DeepBI是如何快速高效的做数据分析的。传统的BI工具和DeepBI的对于显而易见，不管是从数据分析的速度还是可视

overfit同步小助手 2024-03-12 00:03:41 0 收藏

Kafka Producer/Consumer 关系解释及测试demo

这就像在Kafka中，如果某个Partition的消息积压，负责这个Partition的消费者就需要更快地处理消息，以防止延迟。这时，厨师们（Producers）开始忙碌起来，每准备好一道菜，就会放到服务台（Topic）的指定位置（Partition）。在这个餐厅中，有时候会有特别多的订单，厨师需要

overfit同步小助手 2024-03-12 00:03:28 0 收藏

大数据开发（Hadoop面试真题-卷五）

在导入大文件到HDFS时，可以通过自定义分片来更好地管理和利用存储空间。使用Hadoop Archive（HAR）文件：HAR文件是将多个小文件打包成一个大文件的一种方式。可以使用Hadoop提供的’hadoop archive’命令将多个小文件打包成HAR文件。这样可以减少NameNode的元数据

overfit同步小助手 2024-03-11 22:03:47 0 收藏

Hive SQL 开发指南（二）使用（DDL、DML，DQL）

建表注意事项CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在，则抛出异常；用户可以用 IF NOT EXIST 选项来忽略这个异常EXTERNAL 关键字可以让用户创建一个外部表，在建表的同时指定一个指向实际数据的路径（LOCATION）LIKE 允许用户复制现有的表结构，但

overfit同步小助手 2024-03-11 22:03:17 0 收藏