大数据 Hadoop - overfit.cn

基于Hadoop的智慧社区大数仓库系统设计与开发

此外，国外学者还注重从智慧社区大数据中发现潜在的价值和应用场景，如社区健康管理、资源调度等，为智慧社区的智能化发展提供了有力支持。然而，如何高效地管理和分析智慧社区中海量的数据成为一个重要的挑战，因此本文总结了Hadoop技术的优势和特点，并基于此设计和开发了智慧社区的大数据仓库系统。综上所述，本文

overfit同步小助手 2023-12-20 11:03:45 0 收藏

DataGrip连接hive教程

虽然hive官方提供了两种的客户端，但是页面不友好、智能程度低，因此我们往往使用能够提供良好图形页面的第三方客户端。

overfit同步小助手 2023-12-20 11:03:40 0 收藏

Sqoop ---- Sqoop一些常用命令及参数

记录了 Sqoop job 的元数据信息，如果不启动该服务，那么默认 job 元数据的存储目录为~/.sqoop，可在 sqoop-site.xml 中修改。将关系型数据库中的数据导入到 HDFS（包括 Hive，HBase）中，如果导入的是 Hive，那么当 Hive 中没有对应表时，则自动创建。

overfit同步小助手 2023-12-20 06:03:45 0 收藏

虚拟机安装hadoop，hbase（单机伪集群模式）

工作中遇到了大数据方面的一些技术栈，没有退路可言，只能去学习掌握它，就像当初做爬虫一样（虽然很简单），在数据爆发的现在，传统的数据库mysql，oracle显然在处理大数据量级的数据时显得力不从心，所以有些特定的业务需要引进能够处理大数据量的数据库，hadoop提供了分布式文件系统（HDFS）来存储

overfit同步小助手 2023-12-19 21:04:07 0 收藏

第五节Hadoop学习案例——MapReduce案例（WordCount）

overfit同步小助手 2023-12-19 13:03:49 0 收藏

MapRecuce 词频统计案例

MapReduce词频统计案例

overfit同步小助手 2023-12-19 08:03:45 0 收藏

【004hive基础】hive的文件存储格式与压缩

hive文件存储格式与压缩

overfit同步小助手 2023-12-19 05:03:41 0 收藏

HDFS概述及其优缺点

HDFS的全称是hadoop distributed file system，即hadoop的分布式文件系统。见名知意，它就是用来进行文件存储的。毕竟它是大数据的一个组件，用来存储这种海量的数据。它是基于03年10月份，谷歌发表的GFS这篇论文做的开源实现。目前是hadoop的一个核心子项目，用来解

overfit同步小助手 2023-12-19 01:03:51 0 收藏

大数据技术原理与应用-林子雨版-第二章课后习题

在配置 Hadoop 时，Java 的路径 JAVA_HOME 是在 Hadoop 的环境变量配置文件中进行设置的。默认情况下，Hadoop 会在其安装目录下的 etc/hadoop 目录中包含一个名为 hadoop-env.sh 的文件，该文件定义了 Hadoop 的环境变量配置信息，其中包括 J

overfit同步小助手 2023-12-18 22:03:51 0 收藏

HIVE内表与外表的区别

hive内外表的区别，主要总结六点区别

overfit同步小助手 2023-12-18 11:03:16 0 收藏

基于大数据的游戏数据统计可视化系统

在当前数字化时代，游戏产业的快速发展使得游戏数据呈现出爆炸式增长。为了更好地理解玩家行为、优化游戏体验并提高盈利能力，游戏公司对游戏数据统计和可视化分析的需求日益迫切。因此，《基于大数据的游戏数据统计可视化系统》这一课题应运而生，旨在为游戏行业提供高效、精确的数据支持，以满足市场对数据分析的需求。然

overfit同步小助手 2023-12-18 01:03:47 0 收藏

Hadoop MapReduce 统计汽车销售信息

本文将讨论如何使用Hadoop MapReduce来统计汽车销售信息。

overfit同步小助手 2023-12-17 23:03:44 0 收藏

Azkaban从入门到精通以及案例实操系列

Azkaban从入门到精通再到实战一文搞定

overfit同步小助手 2023-12-17 11:03:33 0 收藏

分布式计算第五章大数据多机计算：Hadoop

• NameNode：每个集群一个（也可以有备份），用于维护文件系统的元数据（命名空间），执行文件系统命名空间上的操作，如打开、关闭、重命名文件和目录，以及确定块（Block）和DataNode的映射。• 针对大型数据集，典型文件大小为GB到TB级，不适合小文件读取，并应当在数百个节点上支持数千万的

overfit同步小助手 2023-12-17 06:03:40 0 收藏

HDFS的JAVA API操作

HDFS JAVA API操作详解

overfit同步小助手 2023-12-17 05:03:21 0 收藏

【大数据实验五】 MapReduce初级编程实践

大数据实验五 MapReduce初级编程实践1实验目的1.通过实验掌握基本的MapReduce编程方法；2.掌握用MapReduce解决一些常见的数据处理问题，包括数据去重、数据排序和数据挖掘等。2实验平台已经配置完成的Hadoop伪分布式环境。（1）操作系统：Linux（Ubuntu18.04）（

overfit同步小助手 2023-12-17 03:03:37 0 收藏

Hadoop框架---HDFS的Shell命令操作

其有很多命令，但在生产环境中我们经常使用的命令并没有那么多，因此需要时再回头查阅上图中的命令即可。put命令和copyFromLocal命令有着相同的复制效果，所以我们。这里我们把3台服务器各自对应的节点都打开了，为了方便后续测试。在使用shell命令前，一定要确保我们的Hadoop。自由选择以上任

overfit同步小助手 2023-12-17 02:03:59 0 收藏

Hive 查询优化

set hive.exec.mode.local.auto=true;set mapperd.job.tracker=local;set mapreduce.framework.name=local;set hive.vectorized.execution.enabled=true;

overfit同步小助手 2023-12-17 02:03:54 0 收藏

hadoop权威指南第四版

迭代处理(iterative processing) spark.例如机器学习算法，需要很多迭代。4 SEARCH 搜索 solr (Solr它是一种开放源码的、基于Lucene Java 的搜索服务器)。因为计算机硬盘的发展趋势是：寻址时间的提升远远不如传输速率的提升，如果访问包含大量地址的

overfit同步小助手 2023-12-17 00:03:53 0 收藏

Hive之建表的三种方式

执行的结果是table1 的表与table2的表结构是一致的，但是table1表中的数据为空；Hive建表方式统计了常见的三种建表，分别为直接命令行建表，like建表和as建表。将查询的table2表中id=1的结果插入到table1;或者使用as建表，但表结构会与原表不一致，具体往下看；#原理：直

overfit同步小助手 2023-12-16 17:03:50 0 收藏