hdfs - overfit.cn

【大数据】Hadoop总结

一、概述1. Hadoop特性2. HDFS结构HDFS 架构二、HDFS分布式文件系统1 概述2. HDFS存储数据架构图NameNodeDataNode3 HDFS优点4 HDFS缺点（不适用HDFS的场景）5 HDFS技术细节BlockNameNodeDataNode6 HDFS 副本放置策略

overfit同步小助手 2023-06-12 18:04:22 0 收藏

一百一十一、Hive——从HDFS到Hive的数据导入（静态分区、动态分区）

从HDFS到Hive的数据导入（静态分区、动态分区）

overfit同步小助手 2023-06-11 13:04:19 0 收藏

大数据Doris（二十八）：Broker Load通配符导入HDFS数据并指定列顺序

使用通配符匹配导入两批文件file-10* 和 file-20*。分别导入到 broker_load_t1 和 broker_load_t2 两张表中。其中 broker_load_t1 指定导入到分区 p1 中，并且将导入源文件中第二列和第三列的值 +1 后导入。创建Doris非分区表及分区表，使

overfit同步小助手 2023-06-11 12:04:16 0 收藏

HDFS小文件治理方案

overfit同步小助手 2023-06-11 02:03:57 0 收藏

大数据期末复习资料2023 Beta版

ZooKeeper是一个分布式应用程序协调服务，主要用于解决分布式集群中应用系统的一致性问题。ZooKeeper=文件系统+通知机制。（类似于资源管理系统）HBase是一个高可靠、高性能、面向列、可伸缩的、实时读写的分布式数据库，是Hadoop的一个重要组件。

overfit同步小助手 2023-06-11 01:04:11 0 收藏

基于HDFS实现的简易云盘系统

基于HDFS实现简单的云盘系统。代码开源。

overfit同步小助手 2023-06-11 00:04:03 0 收藏

什么是大数据？大数据有哪些应用场景？

大数据技术的发展已经改变了我们对数据的认知和处理方式，大数据是一种新型的数据处理技术，它涵盖了多个领域，包括计算机科学、网络通信、算法理论、应用统计学等。简要来说，大数据可以定义为处理规模庞大复杂度高数据时所需的技术和方法。

overfit同步小助手 2023-06-09 00:03:43 0 收藏

实验7 Spark初级编程实践

1. Spark读取文件系统的数据2.编写独立应用程序实现数据去重对于两个输入文件A和B，编写Spark独立应用程序（推荐使用Scala语言），对两个文件进行合并，并剔除其中重复的内容，得到一个新文件C。下面是输入文件和输出文件的一个样例，供参考。3.编写独立应用程序实现求平均值问题每个输入文件表示

overfit同步小助手 2023-06-08 23:04:03 0 收藏

hadoop 拒绝连接

在启动 Hadoop 服务之前，需要先检查 Hadoop 的配置文件是否正确，比如 core-site.xml、hdfs-site.xml、yarn-site.xml 等。检查Hadoop配置：检查Hadoop配置文件，如core-site.xml、hdfs-site.xml等，确保其中的配置正确。

overfit同步小助手 2023-06-01 08:04:24 0 收藏

4、sybase相关同步-sybase通过datax同步到hdfs

同步sybase数据库的数据，需要使用通用数据库同步的reader和writer，即RDBMSReader和RDBMWriter。RDBMSReader插件实现了从RDBMS读取数据。在底层实现上，RDBMSReader通过JDBC连接远程RDBMS数据库，并执行相应的sql语句将数据从RDBMS库

overfit同步小助手 2023-06-01 06:03:40 0 收藏

Hadoop集群环境搭建（超详细）

Hadoop集群环境搭建

overfit同步小助手 2023-06-01 05:04:21 0 收藏

HDFS常用操作

大数据学习笔记01学习林子雨大数据教材的一些笔记HDFS常用操作启动Hadoop，在HDFS中创建用户目录“/user/hadoop”；$ cd /usr/local/hadoop$ ./sbin/start-dfs.sh$ jps在Linux系统的本地文件系统的“/usr/local/spark/

overfit同步小助手 2023-05-31 21:04:23 0 收藏

HDFS 高可用的环境搭建

在开始Hadoop集群的HDFS高可用环境搭建之前，需要完成搭建工作。

overfit同步小助手 2023-05-31 19:04:29 0 收藏

Eclipse连接Hadoop（HDFS）

overfit同步小助手 2023-05-30 09:03:49 0 收藏

Hadoop高频面试题

一、HDFS集群架构（HDFS组织架构）二、HDFS数据写流程三、HDFS数据读流程四、MapTask和ReduceTask工作机制（也可回答MapReduce工作原理）五、小文件过多会有什么危害，如何避免六、hadoop（mapReduce）数据倾斜问题七、YARN集群的架构和工作原理八、YA

overfit同步小助手 2023-05-29 19:04:19 0 收藏

超详细教程在VMware上安装Ubuntu18.04系统

**## 安装VMware虚拟机https://blog.csdn.net/qq_37618797/article/details/81144163下载ubuntu18.04镜像链接：https://cn.ubuntu.com/desktop/做好上面两步之后，下面我们开始在VMware上安装ubu

overfit同步小助手 2023-05-29 06:03:45 0 收藏

Hadoop HDFS的API操作

IDEA创建Maven工程，由于版本不一样，这里我使用2022.3版本，有一个将junit加入classpath的设置，还有将各种目录设置：Mark Directory as ：src/main/java 关联为 Sources Root;在HDFS上面进行性文件a.txt的再一次校验值***，将1

overfit同步小助手 2023-05-29 05:03:25 0 收藏

Hadoop大数据开发基础课后答案

Hadoop大数据开发基础课后答案(仅供参考)

overfit同步小助手 2023-05-28 08:05:01 0 收藏

实验3 - HDFS的管理和使用

hadoop

overfit同步小助手 2023-05-27 06:03:41 0 收藏

Hadoop下载与安装

从http://archive.apache.org/dist/hadoop/core/下载Hadoop-3.0.0，下载二进制压缩包文件：hadoop-3.0.0.tar.gz。https://blog.csdn.net/tototuzuoquan/article/details/79954234

overfit同步小助手 2023-05-26 21:04:07 0 收藏