大数据 Hadoop - overfit.cn

hadoop HDFS 常用命令

HDFS（Hadoop Distributed File System）提供了一系列命令行工具，用于管理和操作分布式文件系统。请注意，在实际使用中，请确保命令格式正确，并且与所使用的Hadoop版本兼容。在某些较新版本的Hadoop中，可以直接使用。命令前缀来执行相同的操作。

overfit同步小助手 2024-05-26 07:03:26 0 收藏

Hive基础知识（十）：Hive导入数据的五种方式

1）语法（1）load data:表示加载数据（2）local:表示从本地加载数据到 hive 表；否则从 HDFS 加载数据到 hive 表（3）inpath:表示加载数据的路径（4）overwrite:表示覆盖表中已有数据，否则表示追加（5）into table:表示加载到哪张表（6）stude

overfit同步小助手 2024-05-26 06:04:09 0 收藏

Hadoop：大数据处理的核心框架

Hadoop是一个由Apache基金会所开发的分布式系统基础架构，主要解决的是海量数据的存储和计算问题。Hadoop具有高效、可靠、可扩展和容错性强的特点，使得它成为大数据处理领域的核心框架之一。Hadoop主要由HDFS（Hadoop Distributed File System）和MapRed

overfit同步小助手 2024-05-26 06:03:46 0 收藏

Hbase

HBase 基于 Google的BigTable论文而来，是一个分布式海量列式非关系型数据库系统，可以提供超大规模数据集的实时随机读写。

overfit同步小助手 2024-05-26 06:03:43 0 收藏

Hadoop核心技术

Hadoop生态系统是一个开源的分布式计算平台，由Apache软件基金会开发并维护。其核心组件主要包括HDFS（Hadoop Distributed File System，Hadoop分布式文件系统）、MapReduce以及YARN（Yet Another Resource Negotiator，

overfit同步小助手 2024-05-26 05:03:41 0 收藏

【Hadoop】-HDFS的Shell操作[3]

Hadoop Distributed File System (HDFS) 是一个分布式文件系统，用于存储和处理大规模数据集。HDFS具有高可扩展性、高容错性和高吞吐量的特点，是Apache Hadoop框架的核心组件之一。HDFS提供了一个命令行界面（Shell），用于管理和操作文件系统中的文件和

overfit同步小助手 2024-05-26 04:03:26 0 收藏

头歌—Hive的安装与配置

头歌—hive的安装与配置

overfit同步小助手 2024-05-26 03:03:38 0 收藏

apache-hive-3.1.2-bin 安装

1. hadoop、hive、flink等目前版本基本依赖于jdk1.8, 所以需要专门的JDK环境，毕竟现在大多开发者都是使用>=11版本了。2. windows 系统建议使用VMware通过新建虚拟机安装，适用windows的版本在安装中配置、安装后使用都会挺麻烦(权限、cmd启动脚本、切换开发

overfit同步小助手 2024-05-26 03:03:33 0 收藏

Hive 特殊的数据类型 Array、Map、Struct

获取数组值的方式和我们在 Java 中一样，采用下标的方式访问，当访问的下标超过数组的长度时，并不会报错，它会返回。这里值 Value 中存在整型和字符型数据类型不统一的情况，它会统一将值 Value 都转换成字符型。Map 是 KV 键值对类型，其中存储的字段数量可多可少，但是 KV 键值对的数据

overfit同步小助手 2024-05-26 01:03:23 0 收藏

【Hadoop】--基于hadoop和hive实现聊天数据统计分析，构建聊天数据分析报表[17]

BI：Business Intelligence，商业智能。指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行分析以实现商业价值。简单来说，就是借助BI工具，可以完成复杂的数据分析、数据统计等需求，为公司决策带来巨大的价值。所以，一般提到BI，我们指代的就是工具软件。FineBISu

overfit同步小助手 2024-05-26 00:04:00 0 收藏

Hive中的NVL函数与COALESCE函数

说明： COALESCE是一个函数， (v1, v2, …,vn)依次参考各参数表达式，遇到非null值即停止并返回该值。如果所有的表达式都是空值，最终将返回一个空值。Hive SQL 中的一种聚合函数，它可以返回第一个非空值。功能：如果value为NULL，则NVL函数返回。如果两个参数都为NUL

overfit同步小助手 2024-05-26 00:03:31 0 收藏

Hive中的CONCAT、CONCAT_WS与COLLECT_SET函数

concat用于连接字符串。concat_ws用于按照指定的分隔符连接字符串。与group by和concat_ws一起使用可以实现"列转行。

overfit同步小助手 2024-05-25 21:04:01 0 收藏

孙悟空被压500年也想不出看文档瞬间就会scala和spark以及hadoop

export HADOOP_CONF_DIR=/usr/local/src/hadoop/etc/hadoop #指定hadoop路径。解压tar -zxvf /opt/software/hadoop-2.7.1.tar.gz -C /usr/local/src。export HADOOP_HOME

overfit同步小助手 2024-05-25 20:04:33 0 收藏

震惊Hadoop伪分布式+spark+scala竟如此简单！

验证hdfs：可以登录浏览器地址：192.168.20.11:50070 （ip地址是master的地址）export JAVA_HOME=/opt/jdk #这里是opt目录。修改 hdfs-site.xml 将dfs.replication设置为1。在最后加上export JAVA_

overfit同步小助手 2024-05-25 20:04:13 0 收藏

【大数据】Hadoop下载安装及伪分布式集群搭建教程

一文详解hadoop下载安装以及伪分布式集群搭建教程

overfit同步小助手 2024-05-25 14:03:31 0 收藏

基于Hadoop和Hive的聊天数据（FineBI）可视化分析

Fine BI支持Hadoop Hive数据源，可以直接连接Hive进行数据查询和可视化，且提供多种图表类型，包括折线图、柱状图、饼图等，满足用户不同的数据展示需求。本文将通过FineBI将hadoop和hive联系起来对聊天数据进行可视化报表分析

overfit同步小助手 2024-05-25 11:03:41 0 收藏

Hive on Tez 性能优化

Hive on Tez 性能优化优化Hive on Tez查询永远不能以一种万能的方法来完成。查询的性能取决于数据的大小、文件类型、查询设计和查询模式。在性能测试期间，要评估和验证配置参数和任何SQL修改。建议在工作负载的性能测试期间一次进行一项更改，并且最好在生产环境中使用它们之前评估调整更改在您

overfit同步小助手 2024-05-25 09:04:03 0 收藏

hadoop-yarn简介及常用命令详解（超详细）

本文详细介绍了YARN的概述、架构、特点和原理，并提供了常用命令的详细解释。YARN作为Hadoop生态系统中的重要组件，具有分布式资源管理、多框架支持、灵活的资源调度、高可靠性和容错性、可扩展性以及安全性等特点。通过合理使用YARN命令，可以更好地管理和监控YARN应用程序和集群，提高大数据处理和

overfit同步小助手 2024-05-25 08:03:41 0 收藏

Hive期末测试题（头歌）

头歌实验-Hive期末测试题

overfit同步小助手 2024-05-25 07:04:32 0 收藏

Hadoop介绍：什么是Hadoop？了解Hadoop的应用

Hadoop是一个功能强大、灵活多变的大数据处理框架，它在许多领域都有着广泛的应用前景。随着技术的不断发展和完善，Hadoop将继续为企业和组织提供高效、可靠的大数据解决方案。

overfit同步小助手 2024-05-25 06:03:20 0 收藏