Hadoop - overfit.cn

Hive 浅析

Hive是一个简单的LUA沙盒，除了基本的LUA解释器的功能以外，还提供了诸如热加载等功能。了解HIVE的工作原理有利于了解Lua虚拟机的底层实现机理。本文从是什么-怎么用-为什么三个维度介绍HIVE。

overfit同步小助手 2023-12-29 16:03:35 0 收藏

Hive实战：词频统计

本次实战聚焦于利用Hive在大数据环境下进行词频统计。我们首先在master虚拟机创建文本文件`test.txt`，并将其上传至HDFS作为数据源。接着，启动Hive Metastore服务和客户端，创建外部表`t_word`以读取和处理HDFS中的文本数据。通过精心编写的Hive SQL语句，我们

overfit同步小助手 2023-12-29 16:03:31 0 收藏

HIVE 中INSERT INTO 和 INSERT OVERWRITE 的区别，以及OVERWRITE哪些隐藏的坑

HIVE 中INSERT INTO 和 INSERT OVERWRITE 的区别，以及 overwrite 在分区表和非分区表中使用时的注意事项。

overfit同步小助手 2023-12-29 04:03:39 0 收藏

大数据 | 实验一：大数据系统基本实验 | 熟悉常用的HBase操作

1）理解 HBase 在 Hadoop 体系结构中的角色。2）熟练使用 HBase 操作常用的 shell 命令。3）熟悉 HBase 操作常用的 Java API。

overfit同步小助手 2023-12-29 00:03:27 0 收藏

虚拟机上搭建Hadoop运行环境

比如在上面这台虚拟机上面配置了上述主机名称和IP的映射，那么我要在这台主机访问另外几个IP，只需要访问他们的主机名即可。最大磁盘大小在条件允许的情况下建议是设置40G以上， 20G可能后续还需扩容，这里我们设置的50G.集群化软件之间需要通过端口互相通讯，为了避免出现网络不通的问题，我们可以简单的在

overfit同步小助手 2023-12-28 11:03:52 0 收藏

Hadoop集群搭建

hadoop自学搭建，实战记录

overfit同步小助手 2023-12-27 12:03:20 0 收藏

大数据课程综合实验案例---课设问题汇总

大数据课设问题汇总

overfit同步小助手 2023-12-27 11:03:37 0 收藏

Hadoop入门详解以及Hadoop集群搭建

Hadoop基础知识入门详解，CentOs8搭建Hadoop集群

overfit同步小助手 2023-12-27 01:03:45 0 收藏

手把手教你在linux中部署hadoop以及hadoop功能介绍

我们在学大数据的时候hadoop是躲避不开的地方，所以如何在linux中部署hadoop，下面就是手把手教你如何部署hadoop。你只要复制粘体，然后按enter键就可以了。准备：安装Linux版本的服务器。

overfit同步小助手 2023-12-26 11:03:24 0 收藏

Python 使用Hadoop 3 之HDFS 总结

调用文件系统(HDFS)Shell命令应使用 bin/hadoop fs 的形式。所有的的FS shell命令使用URI路径作为参数。URI格式是。对HDFS文件系统，scheme是hdfs，对本地文件系统，scheme是file。其中scheme和authority参数都是可选的，如果未加指定，就

overfit同步小助手 2023-12-26 07:03:48 0 收藏

phoenix安装以及启动过程中出现的报错

如果没有下载htrace-core-3.2.0-incubating.jar 包，将该包放到/opt/install/hbase-2.2.7/lib下面，hbase每一个节点都要放，然后重启hbase。解决办法：查看/opt/install/hbase-2.2.7/lib 下面是否有htrace-c

overfit同步小助手 2023-12-26 07:03:45 0 收藏

二百一十、Hive——Flume采集的JSON数据文件写入Hive的ODS层表后字段的数据残缺

Flume采集的JSON数据文件写入Hive的ODS层表后字段的数据残缺

overfit同步小助手 2023-12-26 02:03:40 0 收藏

Hive中的常用concat函数——concat函数、concat_ws函数和group_concat函数

overfit同步小助手 2023-12-26 01:03:44 0 收藏

Hadoop集群搭建详细步骤(只有JDK和Hadoop)

Hadoop集群搭建详细步骤，跟着尚硅谷做的，直接用root用户也可以

overfit同步小助手 2023-12-25 15:03:16 0 收藏

【Hadoop】执行start-dfs.sh启动hadoop集群时，datenode没有启动怎么办

执行start-dfs.sh后，datenode没有启动，很大一部分原因是因为在第一次格式化dfs后又重新执行了格式化命令（hdfs namenode -format)，这时主节点namenode的clusterID会重新生成，而从节点datanode的clusterID 保持不变。打开name目录

overfit同步小助手 2023-12-25 13:03:21 0 收藏

Hadoop集群安全模式&磁盘修复

dfs.namenode.safemode.threshold-pct:副本数达到最小要求的block占系统总block数的百分比，默认0.999f。dfs.namenode.safemode.min.datanodes:最小可用datanode数量，默认0。dfs.namenode.safemod

overfit同步小助手 2023-12-25 04:07:28 0 收藏

【大数据】Hive入门➕安装（尚硅谷大数据Hive 3.1.3教程）

hive尚硅谷面试刷题网站✍命令行客户端beeline是Apache Hive提供的一个交互式工具，用于与Hive进行交互式的数据库操作和查询。具体来说，beeline允许用户通过命令行界面连接到Hive服务器，并在该界面下执行Hive SQL语句、查看查询结果、管理数据库和表等。连接到Hive服务

overfit同步小助手 2023-12-25 04:03:31 0 收藏

[AIGC ~大数据] 深入理解Hadoop、HDFS、Hive和Spark：Java大师的大数据研究之旅

本篇博客从"是什么"、"为什么"和"怎么办"三个角度，介绍了Hadoop、HDFS、Hive和Spark等大数据技术。它们在处理大规模数据集和实现分布式计算方面具有重要作用，对于Java大师来说是必不可少的工具。希望本篇博客能帮助你更深入地了解这些技术，并在大数据领域取得更好的成就。请注意，本篇博客

overfit同步小助手 2023-12-25 02:03:42 0 收藏

基于Hadoop+SpringBoot的物品租赁系统设计与实现

本物品租赁系统基于Hadoop平台，利用Java语言、MySQL数据库，结合目前流行的 B/S架构，将物品租赁管理的各个方面都集中到数据库中，以便于用户的需要。在确保系统稳定的前提下，能够实现多功能模块的设计和应用。该物品租赁系统由管理员功能模块和用户模块组成。不同角色的准入制度是有严格区别的。各功

overfit同步小助手 2023-12-25 00:03:31 0 收藏

Hive中处理中文乱码问题的解决方法

如果已经存在的Hive表中包含中文数据，并且出现了乱码问题，可以使用Hive内置的转码函数来处理。综上所述，通过设置Hive的字符集编码、创建表时指定字符集编码和使用转码函数处理中文数据，可以有效地解决Hive中文乱码问题。在实际应用中，根据具体情况选择适合的方法来处理中文数据，以确保数据的正确性和

overfit同步小助手 2023-12-24 22:03:47 0 收藏