大数据 Hadoop - overfit.cn

Linux系统下的hadoop常用命令

选项： - f选项将在文件增长时输出附加数据，如在Unix中一样。

overfit同步小助手 2023-03-31 02:04:31 0 收藏

【大数据入门核心技术-Ambari】（一）Ambari介绍

Apache Ambari是一种基于Web的工具，支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件，包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。Apache Ambari 支持HD

overfit同步小助手 2023-03-31 01:05:19 0 收藏

大数据开发的工作内容与流程

像用cdc、ogg这样的一个技术，会监控数据库的日志。当然很多时候，在生产中的选型比较复杂，而且会有MPP与大数据产品一起使用的场景，但整体的流程不变，只是各阶段的产品有所替换。然后由流（处理）引擎，比如说spark生态圈的spark streaming，当然还有比较新的像flink这些产品进行一个

overfit同步小助手 2023-03-31 01:05:08 0 收藏

MapReduce案列-数据去重

数据去重主要是为了掌握利用并行化思想来对数据进行有意义的筛选，数据去重指去除重复数据的操作。在大数据开发中，统计大数据集上的多种数据指标，这些复杂的任务数据都会涉及数据去重。

overfit同步小助手 2023-03-31 01:05:00 0 收藏

大数据框架之Hadoop：MapReduce（三）MapReduce框架原理——ReduceTask工作机制

ReduceTask工作机制

overfit同步小助手 2023-03-31 01:04:26 0 收藏

Hadoop mapreduce课程设计-全球历史平均气温数据分析

例如：随着大数据的不断发展，hadoop这门技术也越来越重要，很多人都开启了学习大数据之路。此次课程设计，我们采用mongodb作为存储，javaweb作为前端，echarts作为可视化工具，kettle和pandas作为数据清洗工具。使用底层mapeduce作为大数据计算。mongodb数据库：它

overfit同步小助手 2023-03-31 00:05:04 0 收藏

大数据高频面试题一：hive和Oracle的区别

从传统数据库转到大数据的必问题目

overfit同步小助手 2023-03-31 00:04:50 0 收藏

虚拟机Ubuntu安装Hadoop（伪分布式安装）

1.创建hadoop用户在终端输入为hadoop用户设置密码,连续输入两次密码即可为Hadoop用户增加管理员权限，避免以后的麻烦这里我们切换到hadoop用户，进行下一步操作2.ssh的安装以及设置免密登录检测ssh是否安装，有sshd说明已经启动这边我们还需要安装ssh server，这边又ye

overfit同步小助手 2023-03-30 23:04:57 0 收藏

Hadoop学习之SSH免密登录配置(以三台虚拟机为例，完全分布式)

HadoopSSH免密登录配置，完全分布式安装

overfit同步小助手 2023-03-30 23:04:37 0 收藏

Hive中的建表方式

hive中的建表语法，查看表结构方式

overfit同步小助手 2023-03-30 22:05:05 0 收藏

hive表的输入输出格式总结

hive输入输出格式总结

overfit同步小助手 2023-03-30 21:04:49 0 收藏

Hadoop高可用搭建（一）

overfit同步小助手 2023-03-30 21:04:23 0 收藏

spark为什么比hadoop快

spark为什么快

overfit同步小助手 2023-03-30 20:05:12 0 收藏

hive安装 ———附下载链接、安装过程中所遇问题及解决办法（linux）

一、前期准备1. hive 及相关配置文件下载1. hadoop集群2. 安装mysql二、安装hive1. 解压并安装 Hive 使用下面的命令，解压 Hive 安装包：2.配置 MySQL3.配置 Hive5.启动 Hive6. 配置hive下的mysql数据库7.验证 Hive 安装是否成功三

overfit同步小助手 2023-03-30 20:05:03 0 收藏

Hive 搭建（将 MySQL 作为元数据库）

安装 Hive 之前请先确保你当前已经安装好了 Hadoop，并且运行正常。

overfit同步小助手 2023-03-30 20:05:00 0 收藏

HDFS完全分布式集群搭建与配置

(1)防火墙设置:为了防止发生一些奇奇怪怪的错误，请务必关闭所有节点的防火墙，他可能会导致浏览器无法获取集群信息和文件上传集群失败环境搭建，还有通过.start-dfs.sh命令启动集群失败的很大一个原因就是服务器防火墙未关闭的原因。(2)hosts文件配置和主机名:因为这是完全分布式的集群，所以配

overfit同步小助手 2023-03-30 18:04:40 0 收藏

Hadoop虚拟机安装超详细版

5.命名一个虚拟机名称，如：hadoop1。（注：位置不放在C盘）14.配置超级管理员和普通用户（配置root密码）4.选择我们的操作系统:CentOS 64位。6.选择磁盘大小，选择拆分成多个文件。点击CentOS 7,或等待60s。12.选择语言：Engelish。1.创建一个新的虚拟机。2.选

overfit同步小助手 2023-03-30 17:05:27 0 收藏

hadoop理论基础（一）

hadoop理论基础

overfit同步小助手 2023-03-30 17:05:15 0 收藏

Hive详解(超详细)

hive详解

overfit同步小助手 2023-03-30 16:05:00 0 收藏

Hbase命令行语句

语法：desc ‘表格名’语法：create ‘表格名’，‘列族名1’，‘列族名2’，‘列族名n’语法：disable ‘表格名’语法：enable ‘表格名’语法：scan ‘表格名’语法：id_disabled ‘表格名’语法：disable_all ‘条件’语法：enable_all ‘条件’

overfit同步小助手 2023-03-30 16:04:56 0 收藏