大数据 Hadoop - overfit.cn

VMWare建立于W10的共享文件夹

在虚拟机设置 -> 文件夹共享，选择总是启用，点击添加：直接点击下一步：选择原系统共享文件夹位置，并命名：选择启用此共享，并继续：虚拟机菜单栏 -> 虚拟机 -> 安装VMware Tools ，等一会虚拟机会自己打开VMware Tools文件夹。之后一直。......

overfit同步小助手 2023-06-14 02:04:20 0 收藏

Ubuntu 20.0.4 Hadoop3.3.2 安装与配置全流程保姆教程

目录Ubuntu 20.0.4 Hadoop3.3.2 安装与配置全流程保姆级教程；；ubuntu 更换国内源；；ubuntu java 环境配置；；ubuntu hadoop 安装与配置

overfit同步小助手 2023-06-13 08:03:52 0 收藏

大数据MapReduce学习案例：数据去重

数据去重主要是为了掌握利用并行化思想来对数据进行有意义的筛选，数据去重指去除重复数据的操作。在大数据开发中，统计大数据集上的多种数据指标，这些复杂的任务数据都会涉及数据去重。

overfit同步小助手 2023-06-13 03:04:06 0 收藏

hdfs常用命令

简单常用的hdfs命令

overfit同步小助手 2023-06-13 02:04:04 0 收藏

Sqoop详解

Sqoop(SQL-to-Hadoop)是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递，可以将一个关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导入到Hadoop的HDFS中，也可以将HDF

overfit同步小助手 2023-06-12 20:03:56 0 收藏

【大数据】Hadoop总结

一、概述1. Hadoop特性2. HDFS结构HDFS 架构二、HDFS分布式文件系统1 概述2. HDFS存储数据架构图NameNodeDataNode3 HDFS优点4 HDFS缺点（不适用HDFS的场景）5 HDFS技术细节BlockNameNodeDataNode6 HDFS 副本放置策略

overfit同步小助手 2023-06-12 18:04:22 0 收藏

Hadoop | 好用的脚本分享

Hadoop脚本！一键完成，从此告别重复操作！

overfit同步小助手 2023-06-12 10:03:46 0 收藏

使用Hadoop分析气象数据（附代码）

刚学了Hadoop，在网上找完整的分析使用过程进行练手观看。本文数据和方法均来自于大佬的（侵删）

overfit同步小助手 2023-06-12 04:03:56 0 收藏

大数据Hadoop之——总结篇

前面已经介绍了几乎企业里使用到的绝大多数大数据组件了，这里来个简单的总结，主要针对常见的操作进行总结。也方便自己和大家在工作中快速查阅。

overfit同步小助手 2023-06-11 15:04:12 0 收藏

一百一十一、Hive——从HDFS到Hive的数据导入（静态分区、动态分区）

从HDFS到Hive的数据导入（静态分区、动态分区）

overfit同步小助手 2023-06-11 13:04:19 0 收藏

大数据Doris（二十八）：Broker Load通配符导入HDFS数据并指定列顺序

使用通配符匹配导入两批文件file-10* 和 file-20*。分别导入到 broker_load_t1 和 broker_load_t2 两张表中。其中 broker_load_t1 指定导入到分区 p1 中，并且将导入源文件中第二列和第三列的值 +1 后导入。创建Doris非分区表及分区表，使

overfit同步小助手 2023-06-11 12:04:16 0 收藏

第三节 Hadoop学习案例——MapReduce课程设计好友推荐功能

Hadoop学习案例——MapReduce课程设计好友推荐功能

overfit同步小助手 2023-06-11 04:04:04 0 收藏

大数据期末复习资料2023 Beta版

ZooKeeper是一个分布式应用程序协调服务，主要用于解决分布式集群中应用系统的一致性问题。ZooKeeper=文件系统+通知机制。（类似于资源管理系统）HBase是一个高可靠、高性能、面向列、可伸缩的、实时读写的分布式数据库，是Hadoop的一个重要组件。

overfit同步小助手 2023-06-11 01:04:11 0 收藏

基于HDFS实现的简易云盘系统

基于HDFS实现简单的云盘系统。代码开源。

overfit同步小助手 2023-06-11 00:04:03 0 收藏

实验5 MapReduce初级编程实践（2）——编写程序实现对输入文件的排序

一、实验目的通过实验掌握基本的MapReduce编程方法；掌握用MapReduce解决一些常见的数据处理问题，包括数据去重、数据排序和数据挖掘等。二、实验平台操作系统：Linux（建议Ubuntu16.04或Ubuntu18.04）Hadoop版本：3.1.3三、实验内容编写程序实现对输入文件的排序

overfit同步小助手 2023-06-10 20:03:53 0 收藏

Hadoop详细入门知识

现在的我们，生活在数据大爆炸的年代。2020年，全球的数据总量达到44ZB，经过单位换算后，至少在440亿TB以上，也就是说，全球每人一块1TB的硬盘都存储不下。扩展: 数据大小单位，从小到大分别是: byte、kb、mb、Gb、Tb、PB、EB、ZB、DB、NB...单位之间的转换都是满足1024

overfit同步小助手 2023-06-10 11:03:39 0 收藏

启动HBase shell后，HMaster自动关闭

使用HBase shell时，执行命令list时出现错误：ERROR: Can't get master address from ZooKeeper; znode data == null即：原因分析：启动HBase shell前需分别依次启动Hadoop、HBase。（1）启动Hadoop在ub

overfit同步小助手 2023-06-10 04:04:07 0 收藏

窗口函数简介与总结

窗口函数是 SQL 中一类特别的函数。和聚合函数相似，窗口函数的输入也是多行记录。不同的是，聚合函数的作用于由 GROUP BY 子句聚合的组，而窗口函数则作用于一个窗口，这里，窗口是由一个 OVER 子句定义的多行记录。聚合函数对其所作用的每一组记录输出一条结果，而窗口函数对其所作用的窗口

overfit同步小助手 2023-06-10 03:03:39 0 收藏

【Hadoop综合实践】手机卖场大数据综合项目分析

🚀 本文章实现了基于MapReduce的手机浏览日志分析🚀 文章简介：主要包含了数据生成部分，数据处理部分，数据存储部分与数据可视化部分🚀 【本文仅供参考】其中需求实现的方式有多种，提供的代码并非唯一写法，选择适合的方式即可。

overfit同步小助手 2023-06-09 13:03:58 0 收藏

Hadoop之——WordCount案例与执行本地jar包

overfit同步小助手 2023-06-09 12:04:33 0 收藏