TEZ介绍及使用
TEZ介绍及使用
Hadoop学习笔记01:学习Linux常用操作命令
1>.ls (横向查看目录) ll(竖排查看目录)2>.mkdir (创建文件夹)3>.cd 文件夹名 (进入该文件夹) cd …(返回上一级目录)4>.rm 文件/夹名 (删除,可以接-f忽略不存在的文件,-i互动模式,-r递归删除会有危险。这是删除文件)(-rf才是删除文件夹)5>.mv 文件/
Hadoop详细集群搭建
Hadoop详细安装环境:在虚拟机上,或者租一个服务器(用学生证可以认证白嫖喔,阿里云服务器等)
启动hive报错no hbase in
bin/hive 报 which: no hbase in
Hadoop集群完全分布式搭建
hadoop集群分布式的搭建
关于Hbase启动没有Hmaster和Regionserver的问题
没有启动成功需要考虑时间没同步,配置文件是否有误
HBase RowKey设计和实现
HBase由于存储特性和读写性能,在OLAP即时分析中发挥重要作用,Rowkey的设计好坏关乎到HBase的使用情况。我们知道HBase中定位一条数据需要四个维度的限制:RowKey,Column Family,Column Qualifier,Timestamp。RowKey是其中最容易出错的,不
大数据框架之Hadoop:MapReduce(五)Yarn资源调度器
Yarn资源调度器
Hbase的Hmaster进程没有启动/Hbase进程启动不全
Hbase的启动,进程不全,Hmaster没有启动
docker搭建单机hadoop
docker搭建hadoop
Doris安装部署
doris部署
Hadoop 50070端口打不开怎么办?
若已部署成功,请进行第二步排查!Hadoop50070是hdfs的web管理页面,在搭建Hadoop集群环境时,有些大数据开发技术人员会遇到Hadoop 50070端口打不开的情况,引起该问题的原因很多,想要解决这个问题需要从以下方面进行排查!以上是Hadoop 50070端口打不开的正常排查顺序和
kylin的介绍
Kylin是一个开源的分布式分析引擎,主要用于快速查询大数据集合。
Hadoop大数据平台搭建(超详细步骤)
Hadoop大数据平台搭建
Hadoop 集群时间同步设置
设置服务器集群的时间同步,一台机器同时间服务器对时,其他机器与这台服务器对时,就是发生断网等情况,也可以保证内部所有服务器都时间统一;时间同步方式:找一个机器,作为时间服务器,所有的机器与这台集群时间进行定时的同步,比如,每隔十分钟,同步一次时间;...
Hive调优及参数优化(详细版)
Hive调优及参数优化,涵盖:基础配置优化、压缩配置优化、分桶优化、Map Join、Bucket-Map Join、SMB Join、Hive并行操作、Hive索引、数据清洗转换优化、统计分析优化、Hive优化器等等......
HDFS常用命令操作时
HDFS常用命令的实践操作
一篇文章让你理解 大数据所需要的组件
一篇文章让你理解 大数据所需要的组件
大数据常见术语
大数据常见术语一览主要内容包含以下(收藏,转发给你身边的朋友)雪花模型、星型模型和星座模型事实表维度表上钻与下钻维度退化数据湖UV与PV画像ETL机器学习大数据杀熟SKU与SPU即席查询数据湖数据中台ODS,DWD,DWS,DWT与ADST0与T+1用户画像用户画像又称用户角色,作为一种勾画目标用户
Kafka系列 - 06 Kafka 集群环境搭建(三台服务器)
hadoop-101 虚拟机的 IPADDR 的地址改为:192.168.38.23;hadoop-103 虚拟机的 hostname 的地址改为:hadoop103;kafka集群搭建,需要3台虚拟机环境,但是我目前只安装了一台虚拟机,因此还需要准备两台虚拟机环境,正常情况下应该再安装2台虚拟机,