大数据 Hadoop - overfit.cn

【Hadoop和Hbase集群配置】3台虚拟机、jdk+hadoop+hbase下载和安装、环境配置和集群测试

VMware+CentOS7，3台虚拟机配置hadoop集群，jdk+hadoop+hbase的下载和安装、环境配置，Hadoop和HBase集群测试

overfit同步小助手 2024-12-09 05:03:48 0 收藏

大数据-242 离线数仓 - 电商核心交易数据导入全量数据导入方案产品分类、商家店铺、地域组织

业务需求，电商系统业务中最关键的业务，电商的运营活动都是围绕这个主题展开。选取的指标包括：订单数、商品数、支付金额，对这些指标按销售区域、商品类型分析。在大数据的分析中，"电商核心交易"是指电商平台上所有与商品交易相关的核心行为和交易数据的集合。具体来说，核心交易涵盖了商品的浏览、加购物车、下单、支

overfit同步小助手 2024-12-09 04:03:50 0 收藏

Hive 数据仓库

Hive 是由 Facebook 开源的一个数据仓库工具，它允许用户使用类 SQL 语句来进行数据的查询、分析以及管理，将结构化的数据文件映射为数据库中的表，并提供了一套完整的机制用于数据的抽取、转换和加载（ETL）操作。本质上，Hive 是把 HQL 语句转化为 MapReduce、Tez 或者

overfit同步小助手 2024-12-08 15:04:03 0 收藏

hadoop+Spark+django基于Hive的京东网站相关厨具销售数据分析系统(源码+文档+调试+可视化大屏)

随着时代的发展，科技有着飞快的进步，互联网的普及使得很多传统行业都得到了创新和新发展，手机支付、网上淘宝、网上订票都成为了人们生活中不可或缺的部分。于是为设计一个安全便捷，并且使用户更好获取京东网站相关厨具销售数据分析系统，本文主要有安全、简洁为理念，实现用户快捷寻找京东网站相关厨具销售数据分析系统

overfit同步小助手 2024-12-08 12:03:36 0 收藏

Hive ｜ Hive 表如何查看所有分区

Apache Hive 是一个构建在 Hadoop 之上的数据仓库工具，它提供了 SQL 类似的查询语言（称为 HiveQL），使得用户能够更容易地进行大数据处理和分析。在 Hive 中，分区是一种优化查询性能的方法，通过将数据按照一个或多个列的值进行划分，可以显著减少查询时扫描的数据量。本文档将介

overfit同步小助手 2024-12-08 06:03:36 0 收藏

【Hadoop实训】Hive 数据操作②

大数据专业的Hadoop实训之Hive 数据操作查询②

overfit同步小助手 2024-12-08 01:03:25 0 收藏

基于Hadoop的物品租赁系统的设计与实现，LW+源码+讲解

Java语言正式诞生于1995年，是由SUN公司开发研制的OAK语言发展而来的。Java语言继承了OAK语言可跨平台运行的特点，融合了面向对象编程的风格，JAVA以其独有的开放性、跨平台性和面向网络的交互性席卷全球，以其安全性、易用性和开发周期短的特点，迅速从最初的编程语言发展成为全球第一大软件开发

overfit同步小助手 2024-12-07 23:03:42 0 收藏

Apache Hive 通过Docker快速入门

在伪分布式模式下在 docker 容器内运行 Apache Hive，以便为 Hive 提供以下快速启动/调试/准备测试环境。

overfit同步小助手 2024-12-07 19:04:02 0 收藏

【hdfs】【hbase】【大数据技术基础】实践二 HBase Java API编程

为什么可以写命令还要编写程序？自动化批量处理？尽管我们可以通过HBase的shell命令行工具进行数据操作，但在实际的生产环境中，为了提高效率和实现自动化处理，我们通常需要编写程序来与HBase进行交互。本实例使用Eclipse编写java程序，来对HBase数据库进行增删改查等操作，Eclipse

overfit同步小助手 2024-12-07 09:03:51 0 收藏

计算机毕设选题推荐-基于Hadoop的手机销售数据可视化分析

在数字化时代，数据已成为企业最宝贵的资产之一。随着智能手机市场的迅猛发展，手机销售数据的规模和复杂性日益增加，如何从海量数据中提取有价值的信息，成为企业决策者关注的焦点。Hadoop作为一种强大的大数据处理框架，以其高可靠性、高扩展性和高效性，为处理大规模数据集提供了可能。然而，尽管Hadoop在数

overfit同步小助手 2024-12-07 07:03:34 0 收藏

JDK8+MAVEN3.6.3+HADOOP3.2.2，wordcount实践

手把手帮你学会使用JDK8+MAVEN3.6.3+HADOOP3.2.2开展wordcount实践

overfit同步小助手 2024-12-07 04:03:46 0 收藏

Hive 查询（详细实操版）

Hive查询实例操作

overfit同步小助手 2024-12-07 03:04:50 0 收藏

大数据CDP集群中Impala&Hive常见使用语法

【代码】大数据CDP集群中Impala&Hive常见使用语法。

overfit同步小助手 2024-12-06 23:04:09 0 收藏

Hadoop高可用集群部署（保姆级教程）

Hadoop高可用集群部署(保姆级教学)

overfit同步小助手 2024-12-06 18:03:37 0 收藏

Apache Hive 帮助文档

Apache Hive 是一个分布式、容错的数据仓库系统，能够在大规模上进行分析。Hive 元存储（HMS）提供了一个中央元数据仓库，可以轻松分析，以便做出基于数据的明智决策，因此它是许多数据湖架构中的关键组成部分。Hive 构建在 Apache Hadoop 之上，支持通过 HDFS 在 S3、A

overfit同步小助手 2024-12-06 16:04:30 0 收藏

Hadoop完全分布式的搭建（零基础）

本文旨在指导读者如何在虚拟化环境中构建一个完全分布式的Hadoop集群。内容涵盖了从网络和节点的规划到环境设置，再到实现SSH免密登录、配置文件的准备、软件的分发与安装、集群的启动与停止。

overfit同步小助手 2024-12-06 08:04:33 0 收藏

Hadoop参数调优全攻略，让你的集群性能翻倍！

的DataNode节点保存数据的路径由dfs.datanode.data.dir参数决定，其默认值为file://${hadoop.tmp.dir}/dfs/data，若服务器有多个磁盘，必须对该参数进行修改。在进行参数调优时，需要综合考虑集群的硬件配置、作业的特点和性能指标，通过实验和监控来找到最

overfit同步小助手 2024-12-05 23:03:37 0 收藏

探索 Hadoop：构建大数据处理的基石

Hadoop 作为大数据处理领域的中流砥柱，以其独特的架构和强大的功能，为企业和组织处理大规模数据提供了坚实的基础。从数据的分布式存储到高效的并行计算，从与其他技术的集成到性能的优化和未来的发展，Hadoop 不断演进和创新，适应着大数据时代的各种挑战和需求。无论是互联网企业、金融机构还是科研领域，

overfit同步小助手 2024-12-05 20:03:18 0 收藏

深入解析 Hadoop 核心技术：构建大数据处理基石

分布式文件系统，负责存储大规模数据，将数据分割成块并分布存储在多个节点上，具有高容错性和高可靠性。MapReduce：分布式计算模型，用于大规模数据集的并行处理。它将计算任务分解为 Map 阶段和 Reduce 阶段，通过在集群节点上并行执行来提高计算效率。：资源管理框架，负责集群资源的分配和管理，

overfit同步小助手 2024-12-05 19:03:52 0 收藏

Hive 函数（实例操作版2）

Hive 函数

overfit同步小助手 2024-12-05 14:03:37 0 收藏