Hadoop - overfit.cn

集群配置，hadoop配置过程，细节满满

(2)如果你的集群虚拟机已经都创建完成，且确保网络，ssh密钥登陆都做好了后，就可以开始安装jdk和hadoop了。/usr/local/src/hadoop/etc/hadoop 中的对应配置文件中加入下面的相关参数。这一步是集群配置的关键。做一个hadoop的配置流程的全记录，把遇到的问题和细

overfit同步小助手 2023-12-21 02:03:41 0 收藏

大数据：Hadoop刷题

overfit同步小助手 2023-12-20 21:03:41 0 收藏

运行hive语句时有很多info怎么消掉

每次启动hive和执行hive sql命令时都打印了很多没用的INFO日志，看起来很繁琐，那么该怎么消除掉这些没用的日志消息

overfit同步小助手 2023-12-20 16:03:48 0 收藏

基于Hadoop的智慧社区大数仓库系统设计与开发

此外，国外学者还注重从智慧社区大数据中发现潜在的价值和应用场景，如社区健康管理、资源调度等，为智慧社区的智能化发展提供了有力支持。然而，如何高效地管理和分析智慧社区中海量的数据成为一个重要的挑战，因此本文总结了Hadoop技术的优势和特点，并基于此设计和开发了智慧社区的大数据仓库系统。综上所述，本文

overfit同步小助手 2023-12-20 11:03:45 0 收藏

DataGrip连接hive教程

虽然hive官方提供了两种的客户端，但是页面不友好、智能程度低，因此我们往往使用能够提供良好图形页面的第三方客户端。

overfit同步小助手 2023-12-20 11:03:40 0 收藏

Sqoop ---- Sqoop一些常用命令及参数

记录了 Sqoop job 的元数据信息，如果不启动该服务，那么默认 job 元数据的存储目录为~/.sqoop，可在 sqoop-site.xml 中修改。将关系型数据库中的数据导入到 HDFS（包括 Hive，HBase）中，如果导入的是 Hive，那么当 Hive 中没有对应表时，则自动创建。

overfit同步小助手 2023-12-20 06:03:45 0 收藏

虚拟机安装hadoop，hbase（单机伪集群模式）

工作中遇到了大数据方面的一些技术栈，没有退路可言，只能去学习掌握它，就像当初做爬虫一样（虽然很简单），在数据爆发的现在，传统的数据库mysql，oracle显然在处理大数据量级的数据时显得力不从心，所以有些特定的业务需要引进能够处理大数据量的数据库，hadoop提供了分布式文件系统（HDFS）来存储

overfit同步小助手 2023-12-19 21:04:07 0 收藏

第五节Hadoop学习案例——MapReduce案例（WordCount）

overfit同步小助手 2023-12-19 13:03:49 0 收藏

MapRecuce 词频统计案例

MapReduce词频统计案例

overfit同步小助手 2023-12-19 08:03:45 0 收藏

【004hive基础】hive的文件存储格式与压缩

hive文件存储格式与压缩

overfit同步小助手 2023-12-19 05:03:41 0 收藏

HDFS概述及其优缺点

HDFS的全称是hadoop distributed file system，即hadoop的分布式文件系统。见名知意，它就是用来进行文件存储的。毕竟它是大数据的一个组件，用来存储这种海量的数据。它是基于03年10月份，谷歌发表的GFS这篇论文做的开源实现。目前是hadoop的一个核心子项目，用来解

overfit同步小助手 2023-12-19 01:03:51 0 收藏

大数据技术原理与应用-林子雨版-第二章课后习题

在配置 Hadoop 时，Java 的路径 JAVA_HOME 是在 Hadoop 的环境变量配置文件中进行设置的。默认情况下，Hadoop 会在其安装目录下的 etc/hadoop 目录中包含一个名为 hadoop-env.sh 的文件，该文件定义了 Hadoop 的环境变量配置信息，其中包括 J

overfit同步小助手 2023-12-18 22:03:51 0 收藏

HIVE内表与外表的区别

hive内外表的区别，主要总结六点区别

overfit同步小助手 2023-12-18 11:03:16 0 收藏

基于大数据的游戏数据统计可视化系统

在当前数字化时代，游戏产业的快速发展使得游戏数据呈现出爆炸式增长。为了更好地理解玩家行为、优化游戏体验并提高盈利能力，游戏公司对游戏数据统计和可视化分析的需求日益迫切。因此，《基于大数据的游戏数据统计可视化系统》这一课题应运而生，旨在为游戏行业提供高效、精确的数据支持，以满足市场对数据分析的需求。然

overfit同步小助手 2023-12-18 01:03:47 0 收藏

Hadoop MapReduce 统计汽车销售信息

本文将讨论如何使用Hadoop MapReduce来统计汽车销售信息。

overfit同步小助手 2023-12-17 23:03:44 0 收藏

Hadoop学习总结（Hive的安装）

hadoop学习总结——安装hive

overfit同步小助手 2023-12-17 12:05:54 0 收藏

Azkaban从入门到精通以及案例实操系列

Azkaban从入门到精通再到实战一文搞定

overfit同步小助手 2023-12-17 11:03:33 0 收藏

分布式计算第五章大数据多机计算：Hadoop

• NameNode：每个集群一个（也可以有备份），用于维护文件系统的元数据（命名空间），执行文件系统命名空间上的操作，如打开、关闭、重命名文件和目录，以及确定块（Block）和DataNode的映射。• 针对大型数据集，典型文件大小为GB到TB级，不适合小文件读取，并应当在数百个节点上支持数千万的

overfit同步小助手 2023-12-17 06:03:40 0 收藏

HDFS的JAVA API操作

HDFS JAVA API操作详解

overfit同步小助手 2023-12-17 05:03:21 0 收藏

【大数据实验五】 MapReduce初级编程实践

大数据实验五 MapReduce初级编程实践1实验目的1.通过实验掌握基本的MapReduce编程方法；2.掌握用MapReduce解决一些常见的数据处理问题，包括数据去重、数据排序和数据挖掘等。2实验平台已经配置完成的Hadoop伪分布式环境。（1）操作系统：Linux（Ubuntu18.04）（

overfit同步小助手 2023-12-17 03:03:37 0 收藏