Hadoop - overfit.cn

一零零九、Docker搭建全集群环境配置

Docker搭建全集群环境配置

overfit同步小助手 2023-02-10 09:04:06 0 收藏

使用 Amazon EMR 构建您的数据分析平台

Amazon EMR是云上的数据分析平台，通过 Amazon EMR 的图形化或命令行接口，用户可以快速搭建和部署基于 Amazon EC2 实例的数据分析系统，并能动态扩展集群。Amazon EMR 也可以读写其他 AWS 数据存储服务，例如 Amazon S3 和 Amazon DynamoDB

overfit同步小助手 2023-02-10 09:04:00 0 收藏

[Hadoop全分布部署]安装JDK、Hadoop

JDK全称Java Development Kit 中文意思是Java 开发工具包即java标准版开发包，是Oracle提供的一套用于开发java应用程序的开发包，它提供编译，运行java程序所需要的各种工具和资源，包括java编译器，java运行时环境，以及常用的java类库等。JRE Java

overfit同步小助手 2023-02-10 09:03:50 0 收藏

Hadoop生态之Mapreduce

Hadoop三板斧之青龙偃月刀MapReduce

overfit同步小助手 2023-02-10 08:04:18 0 收藏

30分钟掌握 Hive SQL 优化（解决数据倾斜）

如果joinkey有集中的空值热点值，这些空值会聚集到少数个分区中，导致长尾问题。

overfit同步小助手 2023-02-10 08:03:52 0 收藏

Xshell连接不上虚拟机的解决办法

xshell连接不上虚拟机的方法

overfit同步小助手 2023-02-10 07:04:09 0 收藏

[Hadoop全分布部署]配置网络(IP、网关和DNS等)和防火墙

配置网络(IP、网关和DNS等)和防火墙1.1 查看服务器的 IP 地址1.2 设置服务器ip地址1.3 重启网络1.4 pingwww.baidu.com看是否能联网1.5 修改服务器的主机名称1.6 绑定主机名与 IP 地址1.7 关闭防火墙1.8 创建hadoop用户

overfit同步小助手 2023-02-10 07:03:57 0 收藏

学完了Hadoop，我总结了这些重点

大数据生态圈中最基础、最重要的组件。大数据小菜鸟迈出的第一步！

overfit同步小助手 2023-02-10 05:04:00 0 收藏

esProc SPL为何备受青睐，Hadoop Spark 太重？

Hadoop Spark 太重，esProc SPL 很轻

overfit同步小助手 2023-02-10 03:04:22 0 收藏

如何安装配置hbase

文中介绍了如何配置hbase，常见的命令及常见的两个大坑。

overfit同步小助手 2023-02-10 03:04:07 0 收藏

湖仓一体电商项目（十九）：业务实现之编写写入DWS层业务代码

DWS层主要是存放大宽表数据，此业务中主要是针对Kafka topic “KAFKA-DWD-BROWSE-LOG-TOPIC”中用户浏览商品日志数据关联HBase中“ODS_PRODUCT_CATEGORY”商品分类表与“ODS_PRODUCT_INFO”商品表维度数据获取浏览商品主题大宽表。以上

overfit同步小助手 2023-02-10 03:03:39 0 收藏

大数据学习的第一课-大数据概论和技术原理

大数据(Big Data)，指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。采用分步式的方式存储数据时，要考虑数据复制时一致性问题，数据复制与一致性基本原则和设计理念CAP 、A

overfit同步小助手 2023-02-10 01:04:01 0 收藏

大数据之Hadoop3简单入门（一）（通俗易懂）

2.1.1 概念hadoop是一个分布式系统基础架构，主要解决数据存储与海量分析计算的问题，广泛来说，hadoop通常指的是Hadoop生态圈。2.1.2 hadoop优势主要分为4个方面。高可靠性：hadoop底层维护多个数据副本，即使当hadoop某个计算元素或存储出现故障，也不会导致数据丢失。

overfit同步小助手 2023-02-10 00:03:53 0 收藏

大数据知识面试题-通用（2022版）

序列号内容链接1大数据知识面试题-通用（2022版）待续…2大数据知识面试题-Hadoop（2022版）待续…3大数据知识面试题-MapReduce和yarn（2022版）待续…4大数据知识面试题-Zookeepr （2022版）待续…5大数据知识面试题-Hive （2022版）待续…6大数据知识面

overfit同步小助手 2023-02-07 10:04:15 0 收藏

猿创征文｜Hadoop大数据技术

Hadoop大数据技术

overfit同步小助手 2023-01-31 22:04:11 0 收藏

大数据综合项目--网站流量日志数据分析系统(详细步骤和代码)

文章目录前言：基本概述Sqoop概述什么是SqoopFlume概述什么是Flume为什么需要flumeHIve概述什么是Hive系统背景：模块开发数据采集使用Flume搭建日志采集系统数据预处理实现数据预处理数据仓库开发数据导出日志分析系统报表展示前言：提示：这里简述我使用的版本情况：ubuntu1

overfit同步小助手 2023-01-03 17:04:10 0 收藏

Hadoop集群搭建（超级超级详细）

overfit同步小助手 2023-01-02 17:06:59 0 收藏

[Hive]一篇带你读懂Hive是什么

✅作者简介：大家好,我是Philosophy7？让我们一起共同进步吧！🏆 📃个人主页：Philosophy7的csdn博客🔥系列专栏： 👑哲学语录: 承认自己的无知，乃是开启智慧的大门💖如果觉得博主的文章还不错的话，请点赞👍+收藏⭐️+留言📝支持一下博>主哦🤞文章目录一、Hiv

overfit同步小助手 2022-12-29 17:04:21 0 收藏

大数据技术——Flume简介&安装配置&使用案例

1. Flume 概述1.1 Flume简介1.2 Flume的特点1.3 Flume的基础架构2. Flume安装配置2.1 下载地址2.2 安装部署3. Flume 使用案例3.1 实时监控单个追加文件3.2 实时监控目录下多个新文件3.3 实时监控目录下的多个追加文件

overfit同步小助手 2022-12-29 16:04:56 0 收藏

1000个大数据/人工智能毕设选题推荐

正值毕业季我看到很多同学都在为自己的毕业设计发愁Maynor在网上搜集了1000个大数据的毕设选题，希望对大家有帮助～适合大数据毕业设计的项目，完全可以作为本科生当前较新的毕业设计题目选择方向。

overfit同步小助手 2022-12-29 14:02:09 0 收藏