大数据基准测试工具HiBench部署与测试

本文介绍了大数据基准测试工具HiBench的部署,并进行了测试。欢迎大家交流讨论!

Hadoop(一)Hadoop概述

Hadoop(一)Hadoop概述

数据湖(一):数据湖概念

数据湖概念一、什么是数据湖数据湖是一个集中式的存储库,允许你以任意规模存储多个来源、所有结构化和非结构化数据,可以按照原样存储数据,无需对数据进行结构化处理,并运行不同类型的分析对数据进行加工,例如:大数据处理、实时分析、机器学习,以指导做出更好地决策。二、​​​​​​​大数据为什么需要数据湖当前基

一零零九、Docker搭建 全集群 环境配置

Docker搭建 全集群 环境配置

使用 Amazon EMR 构建您的数据分析平台

Amazon EMR是云上的数据分析平台,通过 Amazon EMR 的图形化或命令行接口,用户可以快速搭建和部署基于 Amazon EC2 实例的数据分析系统,并能动态扩展集群。Amazon EMR 也可以读写其他 AWS 数据存储服务,例如 Amazon S3 和 Amazon DynamoDB

[Hadoop全分布部署]安装JDK、Hadoop

JDK全称Java Development Kit 中文意思是Java 开发工具包即java标准版开发包,是Oracle提供的一套用于开发java应用程序的开发包,它提供编译,运行java程序所需要的各种工具和资源,包括java编译器,java运行时环境,以及常用的java类库等。JRE Java

Hadoop生态之Mapreduce

Hadoop三板斧之青龙偃月刀MapReduce

30分钟掌握 Hive SQL 优化(解决数据倾斜)

如果joinkey有集中的空值热点值,这些空值会聚集到少数个分区中,导致长尾问题。

Xshell连接不上虚拟机的解决办法

xshell连接不上虚拟机的方法

[Hadoop全分布部署]配置网络(IP、网关和DNS等)和防火墙

配置网络(IP、网关和DNS等)和防火墙1.1 查看服务器的 IP 地址1.2 设置服务器ip地址1.3 重启网络1.4 pingwww.baidu.com看是否能联网1.5 修改服务器的主机名称1.6 绑定主机名与 IP 地址1.7 关闭防火墙1.8 创建hadoop用户

学完了Hadoop,我总结了这些重点

大数据生态圈中最基础、最重要的组件。大数据小菜鸟迈出的第一步!

esProc SPL为何备受青睐,Hadoop Spark 太重?

Hadoop Spark 太重,esProc SPL 很轻

如何安装配置hbase

文中介绍了如何配置hbase,常见的命令及常见的两个大坑。

湖仓一体电商项目(十九):业务实现之编写写入DWS层业务代码

DWS层主要是存放大宽表数据,此业务中主要是针对Kafka topic “KAFKA-DWD-BROWSE-LOG-TOPIC”中用户浏览商品日志数据关联HBase中“ODS_PRODUCT_CATEGORY”商品分类表与“ODS_PRODUCT_INFO”商品表维度数据获取浏览商品主题大宽表。以上

大数据学习的第一课-大数据概论和技术原理

大数据(Big Data),指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。采用分步式的方式存储数据时,要考虑数据复制时一致性问题,数据复制与一致性基本原则和设计理念CAP 、A

大数据之Hadoop3简单入门(一)(通俗易懂)

2.1.1 概念hadoop是一个分布式系统基础架构,主要解决数据存储与海量分析计算的问题,广泛来说,hadoop通常指的是Hadoop生态圈。2.1.2 hadoop优势主要分为4个方面。高可靠性:hadoop底层维护多个数据副本,即使当hadoop某个计算元素或存储出现故障,也不会导致数据丢失。

大数据知识面试题-通用(2022版)

序列号内容链接1大数据知识面试题-通用(2022版)待续…2大数据知识面试题-Hadoop(2022版)待续…3大数据知识面试题-MapReduce和yarn(2022版)待续…4大数据知识面试题-Zookeepr (2022版)待续…5大数据知识面试题-Hive (2022版)待续…6大数据知识面

猿创征文|Hadoop大数据技术

Hadoop大数据技术

大数据综合项目--网站流量日志数据分析系统(详细步骤和代码)

文章目录前言:基本概述Sqoop概述什么是SqoopFlume概述什么是Flume为什么需要flumeHIve概述什么是Hive系统背景:模块开发数据采集使用Flume搭建日志采集系统数据预处理实现数据预处理数据仓库开发数据导出日志分析系统报表展示前言:提示:这里简述我使用的版本情况:ubuntu1

Hadoop集群搭建(超级超级详细)

Hadoop集群搭建(超级超级详细)

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈