Hadoop - overfit.cn

关于在hadoop中搭建HBase时创建表一直显示“Master is initializing”的问题

今天帮室友解决了这个问题，对于我个人来说感触还是蛮深刻的，毕竟这个东西真的弄得要崩溃了，本想着去找老师问问，但是又想自己再挣扎一下下，果然成功了，这简直就像是中了彩票一样哈哈哈哈~（ps：在写这个value时注意与之前在hadoop当中的core-site.xml中的那个hdfs地址对应，同时将这个

overfit同步小助手 2024-05-27 09:03:43 0 收藏

安装伪分布式Hadoop

步骤一：安装 JDK安装命令如下，将安装包解压到/usr/local/src/目录下。

overfit同步小助手 2024-05-27 08:03:46 0 收藏

hadoop离线与实时的电影推荐系统-计算机毕业设计源码10338

管理员：首页、网站管理（轮播图、公告消息）人员管理（管理员、普通用户）内容管理（电影资讯、资讯分类）模块管理（电影信息、电影类型）个人信息；用户：首页、公告消息、电影资讯、电影信息管理等

overfit同步小助手 2024-05-27 03:03:30 0 收藏

Hive中UNION ALL和UNION的区别

Hive官方提供了一种联合查询的语法，原名为Union Syntax，用于联合两个表的记录进行查询，此处的联合和join是不同的，join是将两个表的字段拼接到一起，而union是将两个表的记录拼接在一起。换言之， join是用于左右拼接，而union是用于上下拼接。联合查询方式UNIONUNION

overfit同步小助手 2024-05-27 00:03:56 0 收藏

如何8步完成hadoop单机安装

Hadoop是一个开源框架，用于存储和处理大规模数据集。

overfit同步小助手 2024-05-26 23:03:44 0 收藏

大数据技术之Hadoop-3.3.4高可用安装部署操作文档

overfit同步小助手 2024-05-26 22:05:00 0 收藏

Hive的索引

Hive支持索引，但是Hive的索引与关系型数据库中的索引并不相同，比如，Hive不支持主键或者外键。Hive索引可以建立在表中的某些列上，以提升一些操作的效率，例如减少MapReduce任务中需要读取的数据块的数量。在可以预见到分区数据非常庞大的情况下，分桶和索引常常是优于分区的。而分桶由于SMB

overfit同步小助手 2024-05-26 20:03:53 0 收藏

伪分布式搭建Hadoop中消失的“DataNode”

我们在搭建hadoop中都会出现一些小小的问题，在伪分布式安装完Hadoop后，jps查看进程的时候缺三少两，今天解决的问题是6个进程中缺少了DataNode。

overfit同步小助手 2024-05-26 19:03:58 0 收藏

【HDFS WEB报错解决方案】Couldn‘t preview the file. NetworkError

检查网络连接确保客户端与服务器lindata01之间的网络连接是通畅的。尝试ping命令或其他网络工具来测试网络连接。验证服务器状态确认lindata01服务器上的WebHDFS服务是否正在运行。检查端口9864是否已开放且服务正在监听该端口。查看服务器日志文件，以获取任何关于服务启动或失败的信息。

overfit同步小助手 2024-05-26 15:02:54 0 收藏

【Hive SQL 每日一题】行列转换

列，分别代表每名同学对应的各科成绩，我们只需要在统计时加入判断条件即可，每列只固定求某科的成绩，如果不是则用。解决问题的方式有许多种，但往往我们需要去注重学习解决问题的思路，希望本文对你有所帮助。行转列操作，其实就是将行数据通过列的方式进行查询展示而已，这里行转列数据共有。会返回两个参数，其中第一个

overfit同步小助手 2024-05-26 13:04:07 0 收藏

Hadoop 常用端口号

请注意，这些是Hadoop组件的标准默认端口，实际部署过程中可以根据需要在配置文件中修改。同时，不同版本的Hadoop可能对某些端口有所调整，请以具体部署环境的实际配置为准。

overfit同步小助手 2024-05-26 09:03:57 0 收藏

hive中split函数相关总结

split 函数一直再用，居然发现没有总结，遂补充一下；

overfit同步小助手 2024-05-26 09:03:44 0 收藏

SparkSession介绍

【代码】SparkSession介绍。

overfit同步小助手 2024-05-26 08:04:02 0 收藏

Hadoop伪分布式集群的搭建

本文是基于jdk8和CentOS6配置的Hadoop伪分布式集群，步骤详细，希望能帮助到给位小伙伴们，有什么不足的请多多包含。

overfit同步小助手 2024-05-26 08:03:57 0 收藏

hadoop HDFS 常用命令

HDFS（Hadoop Distributed File System）提供了一系列命令行工具，用于管理和操作分布式文件系统。请注意，在实际使用中，请确保命令格式正确，并且与所使用的Hadoop版本兼容。在某些较新版本的Hadoop中，可以直接使用。命令前缀来执行相同的操作。

overfit同步小助手 2024-05-26 07:03:26 0 收藏

Hive基础知识（十）：Hive导入数据的五种方式

1）语法（1）load data:表示加载数据（2）local:表示从本地加载数据到 hive 表；否则从 HDFS 加载数据到 hive 表（3）inpath:表示加载数据的路径（4）overwrite:表示覆盖表中已有数据，否则表示追加（5）into table:表示加载到哪张表（6）stude

overfit同步小助手 2024-05-26 06:04:09 0 收藏

Hadoop：大数据处理的核心框架

Hadoop是一个由Apache基金会所开发的分布式系统基础架构，主要解决的是海量数据的存储和计算问题。Hadoop具有高效、可靠、可扩展和容错性强的特点，使得它成为大数据处理领域的核心框架之一。Hadoop主要由HDFS（Hadoop Distributed File System）和MapRed

overfit同步小助手 2024-05-26 06:03:46 0 收藏

Hbase

HBase 基于 Google的BigTable论文而来，是一个分布式海量列式非关系型数据库系统，可以提供超大规模数据集的实时随机读写。

overfit同步小助手 2024-05-26 06:03:43 0 收藏

Hadoop核心技术

Hadoop生态系统是一个开源的分布式计算平台，由Apache软件基金会开发并维护。其核心组件主要包括HDFS（Hadoop Distributed File System，Hadoop分布式文件系统）、MapReduce以及YARN（Yet Another Resource Negotiator，

overfit同步小助手 2024-05-26 05:03:41 0 收藏

【Hadoop】-HDFS的Shell操作[3]

Hadoop Distributed File System (HDFS) 是一个分布式文件系统，用于存储和处理大规模数据集。HDFS具有高可扩展性、高容错性和高吞吐量的特点，是Apache Hadoop框架的核心组件之一。HDFS提供了一个命令行界面（Shell），用于管理和操作文件系统中的文件和

overfit同步小助手 2024-05-26 04:03:26 0 收藏