大数据 Hadoop - overfit.cn

Hadoop启动后没有namenode进程的解决办法

【代码】Hadoop启动后没有namenode进程的解决办法。

overfit同步小助手 2023-08-04 00:04:36 0 收藏

jps命令

当Hadoop集群中出现故障时，可以通过jps命令来查找故障的进程，并排除故障。

overfit同步小助手 2023-08-03 23:04:14 0 收藏

[Hive的基本概念之---数据库 ]

《咏柳》唐·贺知章碧玉妆成一树高，万条垂下绿丝绦。不知细叶谁裁出，二月春风似剪刀。

overfit同步小助手 2023-08-03 21:04:23 0 收藏

CDH6.3.2-组件安装&安全认证

overfit同步小助手 2023-08-03 20:04:03 0 收藏

大数据技术之Hadoop学习(七)——Hive数据仓库

Hive数据仓库的认识与操作

overfit同步小助手 2023-08-03 18:04:12 0 收藏

9、Elasticsearch7.6.1 ES与HDFS相互转存数据-ES-Hadoop

ES-Hadoop是Elasticsearch推出的专门用于对接Hadoop生态的工具，可以让数据在Elasticsearch和Hadoop之间双向移动，无缝衔接Elasticsearch与Hadoop服务，充分使用Elasticsearch的快速搜索及Hadoop批处理能力，实现交互式数据处理。本

overfit同步小助手 2023-08-03 13:05:00 0 收藏

Hive--清除/删除Hive表数据

大数据技术指的是用于处理、分析和管理大规模数据集的技术和工具。随着互联网和物联网的普及，数据量不断增大，对数据的处理和分析需求也日益增加，大数据技术应运而生

overfit同步小助手 2023-08-03 10:04:32 0 收藏

大数据入门之Presto/Trino

Presto是由Facebook开发的分布式sql查询引擎，用来进行高速、实时的数据查询。

overfit同步小助手 2023-08-03 10:04:20 0 收藏

hadoop -- Yarn资源管理

Container是YARN中的资源抽象，它封装了某个节点上的多维度资源，如内存、CPU、磁盘、网络等，当AM向RM申请资源时，RM为AM返回的资源便是用Container表示。NM是每个节点上的资源和任务管理器，一方面，它会定时地向RM汇报本节点上的资源使用情况和各个Container的运行状态；

overfit同步小助手 2023-08-03 09:04:29 0 收藏

Hive（23）：Select高级查询之SORT/ORDER/CLUSTER/DISTRIBUTE BY

order by会对输入做全局排序，因此只有一个reducer，会导致当输入规模较大时，需要较长的计算时间。sort by不是全局排序，其在数据进入reducer前完成排序。因此，如果用sort by进行排序，并且设置mapred.reduce.tasks>1，则sort by只保证每个reduce

overfit同步小助手 2023-08-03 07:03:45 0 收藏

Hadoop: High Available

即HDFS 支持一主一备的架构最多支持 5 个，官方推荐使用 3 个基于Hadoop3.x. 总的来说就是要借助Zookeeper来实现高可用,然后就是编辑Hadoop的配置文件已实现高可用[email protected]。

overfit同步小助手 2023-08-02 22:04:04 0 收藏

大数据平台环境搭建

大数据平台环境搭建（最详细最全面最无脑）

overfit同步小助手 2023-08-02 12:04:23 0 收藏

Hive Code2报错排查

大多数可能的code2报错一般是内存不够，所以加下面这个配置可以有效解决这个问题#取消小表加载至内存中但这个不一定是因为内存不够，其实很多错误都是报这种官方错误的，所以一定要去yarn上看日志。很多人看日志也找不到问题，因为并没有看到全部日志，翻到最底下，点击check here 才能看到完整日志。

overfit同步小助手 2023-08-01 23:04:25 0 收藏

HDFS基本操作命令

命令：hadoop fs -getmerge [-n1] [-skip-empty-file]-p选项的行为与unix mkdir -p非常相似，他会沿着路径创建父目录。下载文件到本地文件系统指定目录，localdst必须是目录。和-put功能一样，只不过上传结束，源数据会被删除。-p保留访问和修改

overfit同步小助手 2023-08-01 21:04:26 0 收藏

bash: 未预期的符号 `newline‘ 附近有语法错误——解决方法

bash: 未预期的符号 `newline' 附近有语法错误

overfit同步小助手 2023-08-01 13:04:40 0 收藏

构建大数据环境：Hadoop、MySQL、Hive、Scala和Spark的安装与配置

安装Hadoop 首先，从Apache Hadoop的官方网站下载所需的Hadoop发行版。选择适合你系统的二进制发行版，下载完成后解压缩到安装目录。然后配置环境变量，并修改Hadoop的配置文件，根据需要进行修改。安装MySQL 安装MySQL服务器是搭建大数据环境的重要一步。更新包管理器后，执行

overfit同步小助手 2023-08-01 10:04:11 0 收藏

hive之with as 和 create temporary区别

在写hivesql语句时，通常因为实现一个比较复杂的逻辑时。

overfit同步小助手 2023-07-31 22:04:33 0 收藏

大数据：Hadoop HDFS，基础架构，去中心化，中心化模式，HDFS基础架构，虚拟机和云服务器部署HDFS

overfit同步小助手 2023-07-31 20:04:37 0 收藏

Hive中的HASH函数规则及示例

Hive中的哈希函数采用的是MurmurHash算法，这是一种非常高效的哈希算法。该算法将输入数据分为若干个块，每个块都进行哈希计算，最终将所有块的哈希值合并起来得到最终的哈希值。在执行上述查询语句时，Hive会自动调用HASH函数对每个姓名进行哈希计算，并将具有相同哈希值的姓名放入同一个分组中，最

overfit同步小助手 2023-07-31 11:04:08 0 收藏

分布式文件系统与HDFS的shell操作及查看元数据

overfit同步小助手 2023-07-31 10:04:20 0 收藏