Hadoop - overfit.cn

Hadoop概述及分析

Hadoop适用于大规模数据处理、实时数据处理、大规模图计算、机器学习和数据挖掘、日志处理和监控以及数据存储和备份等多个应用场景。

overfit同步小助手 2024-11-11 17:03:31 0 收藏

Hive复杂数据类型之array数组

懂底层原理，懂来龙去脉，你才是真的懂。

overfit同步小助手 2024-11-11 10:03:28 0 收藏

Hive集群出现报错信息解决办法

解决办法：上述产生的报错原因是在我重新安装Hive后出现的，经过分析发现是HDFS的目录文件有问题，删除。解决办法：1.删除mysql中的元数据库（metastore，查看你的元数据名称。

overfit同步小助手 2024-11-11 05:03:36 0 收藏

基于Hadoop的汽车大数据分析系统设计与实现【爬虫、数据预处理、MapReduce、echarts、Flask】

本项目旨在构建一个综合性的数据处理和可视化系统，通过整合多种技术高效处理大规模数据。首先，通过网络爬虫从各个来源收集海量数据。这些数据包括标题、品牌、车型、年份、里程、城市、环保标准、售价、首付以及新车含税价等关键字段。这些原始数据被批量收集，需要在有效分析和可视化之前进行处理。数据收集完成后，接下

overfit同步小助手 2024-11-10 01:03:47 0 收藏

大数据开发基于Hadoop+springboot平台的岗位推荐系统

文章底部名片，获取项目的完整演示视频，免费解答技术疑问随着网络科学技术不断的发展和普及化，用户在寻找适合自己的信息管理系统时面临着越来越大的挑战。因此，本文介绍了一套平台的岗位推荐系统，在技术实现方面，本系统采用JAVA、VUE、TOMCAT、HADOOP以及MySQL数据库编程，使用Spring

overfit同步小助手 2024-11-09 17:03:24 0 收藏

大数据之——Window电脑本地配置hadoop系统（100%包避坑！！方便日常测试，不用再去虚拟机那么麻烦）

之前我们的hadoop不管是伪分布式还是分布式，都是配置在虚拟机上，我们有的时候想要运行一些mapreduce、hdfs的操作，又要把文件移到虚拟机，又要上传hdfs，麻烦得要死，那么有的时候我们写的一些java、python的hadoop代码，我们只想在本地运行一下看看有没有问题、会是一个什么结果

overfit同步小助手 2024-11-09 08:03:36 0 收藏

hive-3.1.3部署文档

我要在192.168.128.131上远程访问上述的192.168.128.130服务器上的hive服务。由于内嵌模式使用场景太少（基本不用），所以仅练习安装查看基础功能。1. 上传hive安装包、解压到指定位置。1. 上传hive安装包、解压到指定位置。1、安装mysql 5.7.18。2、上传m

overfit同步小助手 2024-11-09 02:04:15 0 收藏

Linux+centOS Hadoop——Hive的配置（自学记录）

使用bin/hive启动hive会话时会出现“SLF4J: Class path contains multiple SLF4J bindings”的错误，这是由于在类路径中存在多个SLF4J绑定。链接: https://pan.baidu.com/s/1pbUjVBTHlxD6iFJADlgmuw

overfit同步小助手 2024-11-09 02:03:58 0 收藏

3.Hadoop环境搭建之Hadoop的安装和配置

创建目录name:mkdir /home/hadoop/hadoop-2.7.4/hdfs/name。创建目录data:mkdir /home/hadoop/hadoop-2.7.4/hdfs/data。到指定目录：cd /home/hadoop/hadoop-2.7.4/etc/hadoop。到指

overfit同步小助手 2024-11-08 19:03:53 0 收藏

【大数据】Hive快速入门

创建数据库：如果数据库已存在，则不执行创建操作。：指定数据库在HDFS上的存储位置。：为数据库添加注释。修改数据库：修改数据库的存储位置。：修改数据库的属性。删除数据库：如果数据库存在，则执行删除操作。[CASCADE]：级联删除，如果数据库中有表，则连同表一起删除。创建表[EXTERNAL]：创建

overfit同步小助手 2024-11-08 18:03:40 0 收藏

Hadoop中的元数据膨胀问题是什么，如何应对？

在Hadoop中，元数据膨胀（Metadata Bloat）是指由于大量的文件或目录存在于Hadoop分布式文件系统（HDFS）中，导致NameNode上的元数据信息急剧增加，从而影响NameNode的性能和稳定性。这一问题通常发生在HDFS中有大量小文件或者频繁创建和删除文件的情况下。

overfit同步小助手 2024-11-08 06:03:43 0 收藏

基于大数据的养老院数据分析与可视化的设计和实现(源码+LW+调试文档)

Java的主要特点是简单性、面向对象、分布式、健壮性、安全性和可移植性。Java的设计初衷是让程序员能够以优雅的方式编写复杂的程序。它支持 Internet 应用的开发，并内建了网络应用编程接口，极大地便利了网络应用的开发。同时，Java的强类型机制和异常处理功能确保了程序的健壮性。Java分为三个

overfit同步小助手 2024-11-08 02:03:36 0 收藏

Hive部署测试(4.0.0)

hadoop版本3.3.6 mysql版本8.0.20。

overfit同步小助手 2024-11-07 13:03:43 0 收藏

大数据技术原理及应用课实验1 熟悉常用的Linux操作和Hadoop操作

（1）使用hadoop用户登录Linux系统，启动Hadoop（Hadoop的安装目录为“/usr/local/hadoop”），为hadoop用户在HDFS中创建用户目录“/user/hadoop”（2）删除上面创建的目录“a1/a2/a3/a4” （在“/tmp”目录下面），然后查看“/tmp”

overfit同步小助手 2024-11-07 12:03:26 0 收藏

Hive使用与介绍

Hive 提供了一种简化的方式来查询和分析大数据集，通过 HiveQL 让用户能够轻松地与大数据进行交互。如果你有具体的使用场景或遇到的问题，随时可以提供更多详细的帮助。

overfit同步小助手 2024-11-07 10:03:24 0 收藏

【头歌】Hive表DDL操作（一）答案

【头歌】Hive表DDL操作（一）答案第1关：Create/Alter/Drop 数据库第2关：Create/Drop/Truncate 表第3关：Alter 表/列第4关：表分区

overfit同步小助手 2024-11-06 23:03:34 0 收藏

Hadoop/HBase/HDFS 常用默认端口总结列举,以及作用

必须要吐槽一句, 光看这些端口, 就能发现Hadoop设计的复杂性在2020s的今天显得有点格格不入, 如今, 如果没有历史包袱,如果非必要, 还是选择同类替换的应用对需求进行专项专用吧。节点管理器本地化端口（默认为8040）：用于节点管理器与本地化服务进行通信，获取应用程序所需的资源。应用程序

overfit同步小助手 2024-11-06 21:03:53 0 收藏

Python爬虫基于Hadoop的NBA球员大数据分析与可视化系统

在对大数据的深入研究后，根据其前景，包括数据方面的发展与价值，本套系统从用户痛点需求进行分析入手，对系统架构进行了设计，随后完成了系统方面的具体设计，最后为数据入库对DB进行配置和设计，最后到系统搭建和编码实现，分别为后台数据处理，在数据转换方面包括数据的clean、临时存储落地，数据经过完全处理后

overfit同步小助手 2024-11-06 20:03:48 0 收藏

【Hadoop】【hdfs】【大数据技术基础】实践一利用Java API与HDFS进行交互

在该界面中，需要在“Select type”下面的文本框中输入“HDFSFileIfExist”，Eclipse就会自动找到相应的类“HDFSFileIfExist-(default package)”（注意：这个类在后面的导出JAR包操作中的Launch configuration中会被用到），然

overfit同步小助手 2024-11-06 19:04:10 0 收藏

【Hadoop-HA 搭建】hadoop-ha 高可用集群配置

搭建hadoop高可用集群，首先确保搭建了hadoop集群，zookeeper集群。hadoop 三个集群节点分别为主节点 master，两个副节点node01、node02。

overfit同步小助手 2024-11-06 14:03:27 0 收藏