大数据 - overfit.cn

山东大学2022年6月27日软件学院数据库系统期末考试回忆版

overfit同步小助手 2023-06-25 09:04:02 0 收藏

RabbitMQ消息应答概念

因为这种模式如果消息在接受之前，消费者那边出现连续或者channel关闭，那么消息就丢失了，自动应答：当消费者接收到信息的时候，自动告诉mq处理完毕信息，及消息发送后立即被认为已经传送成功，但是实际上还没有处理完毕。生产者发送消息到队列中，消费者需要完成这个任务，并且处理信息，那么队列中的信息就会被

overfit同步小助手 2023-06-25 08:04:26 0 收藏

spark第四章：SparkSQL基本操作

接下来我们学习SparkSQL他和Hql有些相似。Hql是将操作装换成MR，SparkSQL也是，不过是使用Spark引擎来操作，效率更高一些SparkSQL的常用操作基本就这些,至于项目吗,下次专门在写一次吧。

overfit同步小助手 2023-06-25 08:04:14 0 收藏

大数据项目实战——基于某招聘网站进行数据采集及数据分析（三）

大数据项目实战第三章数据采集文章目录大数据项目实战学习目标一、分析与准备1、分析网页结构2、数据采集环境准备二、采集网页数据1.创建响应结果 JavaBean 类2.封装 HTTP 请求的工具类1）定义三个全局变量2）编写 packageHeader() 方法3）编写 packageParam()

overfit同步小助手 2023-06-25 06:04:26 0 收藏

记一次dubbo消费者注册失败找不到服务提供者问题

dubbo消费者找不到服务问题排查笔记

overfit同步小助手 2023-06-25 04:04:09 0 收藏

【SpringCloud入门】-- 初识Eureka注册中心

SpringCloud微服务之Eureka入门

overfit同步小助手 2023-06-25 04:04:06 0 收藏

基于Spark的音乐专辑数据分析

基于Spark的音乐专辑大数据分析

overfit同步小助手 2023-06-25 04:03:45 0 收藏

分布式计算----期末复习题（仅供参考）

单独看yarn的进程：start-yarn.sh ，出现resourcemanager（主节点），nodemanager（从节点）。(3) core- site.xml作用: 配置NameNode的所在主机或者通讯地址及NameNode格式化后的目录的路径。3.如果你使用的是Hadoop3.x版本，

overfit同步小助手 2023-06-25 00:04:12 0 收藏

Kylin (一) ---------- 概述

kylin 概述

overfit同步小助手 2023-06-24 23:04:38 0 收藏

数据湖——Hudi基本概念

hudi

overfit同步小助手 2023-06-24 23:04:24 0 收藏

超级独角兽 Databricks 的崛起之路

overfit同步小助手 2023-06-24 23:03:53 0 收藏

ubuntu设置MySQL密码

在ubuntu中设置MySQL用户密码

overfit同步小助手 2023-06-24 20:03:59 0 收藏

RabbitMQ安装和配置

overfit同步小助手 2023-06-24 19:04:49 0 收藏

大数据的常用算法（分类、回归分析、聚类、关联规则、神经网络方法、web数据挖掘）

在大数据时代，数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程，也是一种决策支持过程。其主要基于，模式学习，统计学等。通过对大数据高度自动化地分析，做出归纳性的推理，从中挖掘出潜在的模式，可以帮助企业、商家

overfit同步小助手 2023-06-24 19:04:36 0 收藏

Hadoop大数据处理与分析教程

本文所需文件(Vmware虚拟机、密匙、乌班图系统、JDK、Hadoop）链接：https://pan.baidu.com/s/1yU5s36Rgl_jE_mAmHsJBfQ?pwd=i5s6提取码：i5s6。

overfit同步小助手 2023-06-24 18:04:21 0 收藏

《大数据系统与编程》MapReduce程序实现词频统计实验报告

《大数据系统》的课程实验，包括实验目的、实验要求与实验过程记录（有截图），仅供学生初级参考，引用图片请标明出处。

overfit同步小助手 2023-06-24 15:04:34 0 收藏

Flink概念及应用场景

flink应用场景及架构

overfit同步小助手 2023-06-24 15:04:31 0 收藏

Kafka实时数据即席查询应用与实践

Kafka中的实时数据是以Topic的概念进行分类存储，而Topic的数据是有一定时效性的，比如保存24小时、36小时、48小时等。而在定位一些实时数据的Case时，如果没有对实时数据进行历史归档，在排查问题时，没有日志追述，会很难定位是哪个环节的问题。

overfit同步小助手 2023-06-24 15:04:01 0 收藏

Kafka

大数据面试- Kafka

overfit同步小助手 2023-06-24 14:04:03 0 收藏

Hive | 报错锦集

Hive使用过程中遇到的部分问题分享，快来看看吧！

overfit同步小助手 2023-06-24 12:04:08 0 收藏