Hadoop - overfit.cn

Hive与Mysql完全卸载与重装

Ubuntu 20.04上安装和卸载MySQL 8.0 - 简书 (jianshu.com)Hive 3.x 安装部署详细教程，每一步清晰明了 - 掘金 (juejin.cn)Hive之MySQL安装与卸载_hive卸载-CSDN博客。启动Hive前要先启动hadoop和mysql。Hive卸载重装

overfit同步小助手 2024-06-13 10:03:47 0 收藏

搭建单机伪分布式Hadoop+spark+scala

hdfs://master#注意这里是ip映射可改为自己的ip地址。/usr/local/src/hadoop/tmp

overfit同步小助手 2024-06-13 03:03:44 0 收藏

Hive连接函数 concat 和 concat_ws 使用示例

CONCAT 函数：适用于简单的字符串拼接操作，将多个字符串连接成一个新的字符串。可以用于创建自定义的文本字段，合并多个字段的内容，或者添加固定的分隔符。适合在SQL查询中进行简单的字符串合并操作，不涉及复杂的逻辑或条件。CONCAT_WS 函数：适用于需要指定分隔符的字符串拼接操作，其中 WS 表

overfit同步小助手 2024-06-12 22:03:37 0 收藏

day1-hadoop伪分布式集群配置

进入Linux操作系统中存放应用安装包的目录/export/software/（该目录需提前创建），然后执行rz -bey命令将JDK安装包上传到虚拟的/export/software/目录下。（13）修改 start-yarn.sh文件（在hadoop-3.2.0/sbin目录下），在文件前面增加

overfit同步小助手 2024-06-12 21:03:22 0 收藏

Hadoop 集群 jps查看进程时没有datanotes 的原因

查看namenode version。

overfit同步小助手 2024-06-12 10:03:47 0 收藏

Hive判空函数 COALESCE 和 NVL 使用示例

COALESCECOALESCE函数用于返回参数列表中第一个非NULL的数值或表达式。语法： COALESCE(value1, value2, …) ，参数可以是多个数值或表达式。返回值：返回参数列表中第一个非NULL的数值或表达式，如果所有参数均为NULL，则返回NULL。示例： SELECT C

overfit同步小助手 2024-06-12 10:03:34 0 收藏

Hive安装教程-Hadoop集成Hive

本文将介绍安装和配置Hive的步骤。在开始之前，我们需要满足一些安装条件，包括安装JDK、MySQL和Hadoop。我们将逐步指导您完成这些准备工作，并详细说明如何下载、解压和设置Hive。接下来，我们将修改Hive的配置文件，并创建Hive的元数据数据库。最后，我们将演示如何初始化Hive数据库并

overfit同步小助手 2024-06-12 08:03:39 0 收藏

Hive基本查询操作

查询出工作职责涉及hive的并且工资大于8000的公司名称以及工作经验。

overfit同步小助手 2024-06-12 07:03:39 0 收藏

Linux CentOS下大数据环境搭建（zookeeper+hadoop+hbase+spark+scala）

本篇文章是结合我个人学习经历所写，如果遇到什么问题或者我有什么错误，欢迎讨论。

overfit同步小助手 2024-06-11 22:03:16 0 收藏

hive与idea的连接

Hive 是一个建立在 Hadoop 之上的数据仓库系统，提供了类似于 SQL 的查询语言 HiveQL，使用户能够方便地在 Hadoop 分布式存储中执行查询和分析。它将结构化数据映射到 Hadoop 的分布式文件系统（HDFS）中，并利用 MapReduce 处理数据。Hive 的主要目标是提供

overfit同步小助手 2024-06-11 21:03:39 0 收藏

hive中复杂数据类型(array，map，struct)讲解

hive复杂数据类型的创建、查询与使用

overfit同步小助手 2024-06-11 05:03:45 0 收藏

05 Hadoop简单使用

主要讲到了hadoop2.x和hadoop3.x变化，HDFS常用命令，Java操作HDFS，MapReduce，压缩和yarn常用命令。

overfit同步小助手 2024-06-11 03:03:45 0 收藏

Hadoop平台搭建配置JDK环境

向其他主机传送文件或者文件夹。

overfit同步小助手 2024-06-11 01:03:33 0 收藏

摸鱼大数据——Hive表操作——分区表

特点: 分区表会在HDFS上产生目录。查询数据的时候使用分区字段筛选数据，可以避免全表扫描，从而提升查询效率注意: 如果是分区表，在查询数据的时候，如果没有使用分区字段，它回去进行全表扫描，会降低效率只需要记住一点，分区表是用来提升Hive的数据分析效率。

overfit同步小助手 2024-06-11 00:03:13 0 收藏

在window11系统下安装和配置Hadoop并在idea上连接HDFS的过程中可能出现的问题以及解决办法

hadoop环境配置

overfit同步小助手 2024-06-10 17:03:44 0 收藏

【大数据】MapReduce

overfit同步小助手 2024-06-10 15:03:42 0 收藏

Hive 日期处理函数汇总

最近项目处理日期操作比较繁杂,使用Hive的日期函数也较频繁。

overfit同步小助手 2024-06-09 19:03:24 0 收藏

Hive中高频常用的函数和语法

如果没有前面的行（例如，当前行是第一行），则返回指定的默认值。在这些示例中，LAG()函数被用于获取结果集中的前一行的值，以进行相关的计算或分析。功能介绍： IFNULL(expression, default_value)函数用于处理NULL值，当表达式的值为NULL时，返回指定的默认值，以确保结

overfit同步小助手 2024-06-09 16:03:54 0 收藏

HDFS 之 DataNode 核心知识点

（2）删除原来HDFS文件系统留存的文件（ /opt/module/hadoop-2.7.2/data和 logs ），否则会出现hadoop2与hadoop3相互出现在集群中，因为两者的数据是相同的。添加主机名称（要退役的节点）【1】一个数据块在 DataNode上以文件形式存储在磁盘上，包括两个

overfit同步小助手 2024-06-09 09:04:45 0 收藏

入门指南：理解Hadoop中的MapReduce

1.MapReduce是一种编程模型，用于处理大规模数据集的并行计算。它将任务分解成两个关键阶段：Map阶段和Reduce阶段。在Map阶段，数据被切分成独立的数据块，并由多个Map任务并行处理；在Reduce阶段，Map任务的输出被汇总和整合，最终生成最终结果。定义：MapReduce是一个分布式

overfit同步小助手 2024-06-09 01:03:47 0 收藏