大数据 Hadoop - overfit.cn

记apache atlas导入hive元数据过程及问题处理

Apache atlas集成hive，导入hive元数据，导入过程中的问题处理

overfit同步小助手 2024-08-17 23:03:56 0 收藏

Hadoop、HDFS 相关面试题

Hadoop 是一个开源的分布式存储和计算框架，最初由 Apache 软件基金会开发。它允许大规模数据处理和存储，具有高度可靠性和可扩展性。分布式文件系统HDFS—— 用于数据存储计算框架YARN—— 用于资源管理和作业调度HDFS 是 Hadoop 生态系统的核心组件之一，用于存储大规模数据，并提

overfit同步小助手 2024-08-17 06:03:44 0 收藏

Hadoop+Flink研发环境部署+开发

修改Flink目录下conf/flink-conf.yaml,在末尾添加classloader.check-leaked-classloader: false，然后保存。-- 配置HDFS网页登录使用的静态用户为root-->-- 指定ResourceManager的地址-->-- 指定MapRed

overfit同步小助手 2024-08-17 06:03:35 0 收藏

Hadoop的读写流程

HDFS是一个高度容错的分布式文件系统，它设计用于运行在通用硬件上。HDFS将数据分割成固定大小的块，并将这些块存储在多个节点上，以实现数据的高可用性和可扩展性。每个数据块都会被复制到多个节点上，形成一个副本集，从而确保数据的可靠性。

overfit同步小助手 2024-08-17 04:03:50 0 收藏

基于Hadoop平台的电信客服数据的处理与分析④项目实现：任务17：数据分析

JDBCUtil类：用于创建MySQL的JDBC连接、关闭连接。//定义JDBC连接器实例化所需要的固定参数/*** 实例化JDBC连接器对象*/try {/*** 释放连接器资源*/try {= null &&!= null &&!= null &&!JDBCInstance类：用于以单例模式获取

overfit同步小助手 2024-08-17 02:03:45 0 收藏

基于老年一站式服务平台设计与实现【源码+文档+PPT】

随着人口老龄化趋势加剧，老年一站式服务平台应运而生。该平台旨在为老年人提供全面的生活照护、健康咨询、娱乐活动等服务，通过整合社会资源，打造一个便捷、高效、安全的服务环境。不仅满足了老年人多样化的生活需求，还促进了社会和谐与进步。在当前社会，随着人口老龄化的不断加剧，老年人口比例持续上升，这不仅对社会

overfit同步小助手 2024-08-17 01:04:02 0 收藏

物联网架构之Hadoop

Hadoop的体系结构设计旨在处理和分析大数据集，通过分布式存储（HDFS）、资源管理（YARN）、并行计算（MapReduce）等核心组件，提供了一种可靠、可扩展的大数据解决方案。其生态系统的丰富性和灵活性使得Hadoop能够适应不同类型和规模的数据处理需求。hadoop的核心结构Hadoop分布

overfit同步小助手 2024-08-17 01:03:56 0 收藏

kerberos HA高可用部署方案详解

KDC高可用方案1、安装JCE集群在开启Kerberos服务之前，必须在Ambari Server主机和其他所有主机上安装JCE注意:如果集群正在使用Oracle JDK，必须在集群所有主机上分发并安装JCE，在JCE安装完成后，切记要重启Ambari Server。如果集群正在使用Open JDK

overfit同步小助手 2024-08-17 00:03:12 0 收藏

大数据综合项目——招聘网大数据职位分析

关键词：Hadoop集群；Mysql数据库；SQL server；Hive；Sqoop；JDK。

overfit同步小助手 2024-08-16 17:03:36 0 收藏

大数据-82 Spark 集群模式启动 Hadoop HDFS Spark 与 HelloWorld！

上节完成了Spark的环境配置，集群配置，并且通过分发把服务分发到了别的服务器上等内容。本节我们对集群进行启动和测试，需要HDFS和Spark的环境。这里Spark提供了一个官方的HelloWorld（前提你配置好环境变量，不然你需要到指定目录执行）我们通过查看 h121 的日志，可以看到是 808

overfit同步小助手 2024-08-16 11:04:02 0 收藏

一篇搞定，Hadoop高可用集群搭建及API调用，超详细

在Hadoop1中NameNode存在一个单点故障问题，如果NameNode所在的机器发生故障，整个集群就将不可用(Hadoop1中虽然有个SecorndaryNameNode，但是它并不是NameNode的备份，它只是NameNode的一个助理，协助NameNode工作，SecorndaryNam

overfit同步小助手 2024-08-16 04:03:55 0 收藏

Kyuubi1.6.0+Spark3.0.0部署

Kyuubi1.6.0是支持Spark3.0.0的最后一个版本，再往上需要更高的Spark版本，我这里就没再测试。

overfit同步小助手 2024-08-16 03:03:17 0 收藏

hive3.1.2的详细安装配置

因为hive3.1.2中的有些jar包和比hadoop版本中的jar包版本低，所以我们需要进行一个jar包的替换，把hive中的/hive/lib中的guava-19.0.jar包改名为guava-19.0.jar.bak并从/hadoop-3.1.3/share/hadoop/common/lib

overfit同步小助手 2024-08-15 11:03:37 0 收藏

Hadoop-未授权访问-内置配合命令执行RCE

overfit同步小助手 2024-08-15 07:03:47 0 收藏

Hive Transaction事务表（含实现原理）

hive事务表

overfit同步小助手 2024-08-14 10:03:59 0 收藏

【大数据】重塑时代的核心技术及其发展历程

本文旨在全面而简洁地概览大数据技术，深入剖析其基本概念与发展历程。开篇，文章首先阐明了大数据技术的核心概念，即指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，这些数据集合具有海量规模、高速增长和多样化的特点。随后，文章详细探讨了大数据技术如何通过这些特性，在数据存储、处理、分析及

overfit同步小助手 2024-08-14 08:03:31 0 收藏

搭建hadoop+spark完全分布式集群环境

tar -zxvf jdk-8u181-linux-x64.tar.gz -C /home/hadoop/apps #解压到apps下。进入/home/hadoop/apps/hadoop-2.7.6/etc/Hadoop。sudo vi /etc/profile #修改配置文件。start-s

overfit同步小助手 2024-08-14 02:03:49 0 收藏

Hadoop 面试题（六）

1. 简述Google三驾马车是Hadoop等分布式系统的基石，其中论文()不属于三驾马车之一？2. 简述现有一个安装 2.6.5 版本的 Hadoop 集群，在不修改默认配置的情况下，存储 200 个每个 200M 的文本文件，请问最终会在集群中产生多少个数据块（包括副本）？3. 假设有Had

overfit同步小助手 2024-08-13 22:03:47 0 收藏

Hadoop，ActiveMQ，RabbitMQ，Springboot Actuator未授权访问漏洞（附带修复方法）

Hadoop是⼀个由Apache基⾦会所开发的分布式系统基础架构，由于服务器直接在开放了Hadoop 机器 HDFS 的 50070 web 端⼝及部分默认服务端⼝，⿊客可以通过命令⾏操作多个⽬录下的数据，如进⾏删除，下载，⽬录浏览甚⾄命令执⾏等操作，产⽣极⼤的危害。在 Actuator 启⽤的情况

overfit同步小助手 2024-08-13 20:03:49 0 收藏

Hive的数据库表操作以及数据上传

关于hive的安装、基本的知识，以及hive中数据库表操作等学习练习笔记

overfit同步小助手 2024-08-13 02:03:52 0 收藏