大数据-玩转数据-FLINK(Yarn模式)的安装与部署
在这些容器上,Flink 会部署JobManager 和 TaskManager 的实例,从而启动集群。一个Job会对应一个Flink集群,每提交一个作业会根据自身的情况,都会单独向yarn申请资源,直到作业执行完成,一个作业的失败与否并不会影响下一个作业的正常提交和运行。内存集中管理模式:在Yar
大数据——技术生态体系
SparkR 是 Apache Spark 生态系统中的一个项目,它提供了一个接口,允许 R 语言用户利用 Spark 的分布式计算能力来进行数据分析和处理。:Spark SQL 可以与其他 Spark 组件(如Spark Streaming、Spark MLlib等)集成,使用户能够在一个统一的
关于HBase集群中的Hmaster节点刚启动就挂掉的解决方法
关于HBase集群中的Hmaster节点刚启动就挂掉的解决方法
尚硅谷大数据hadoop教程_mapReduce
mapReduce三类进程。
大数据Hadoop之——部署hadoop+hive+Mysql环境(window11)
win环境下大数据Hadoop的部署hadoop+hive环境
【项目实战】基于Web的管理和监控Hadoop集群工具——Ambari入门介绍
Apache Ambari是一种基于Web的工具,它提供了一个易于使用的Web界面 ,是一个强大的开源的集群管理工具,它可以帮助管理员轻松管理和监控Hadoop集群,支持Apache Hadoop集群的供应、管理和监控。
hadoop模拟试题
数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)SecondaryNameNode会将edits文件和fsimage复制到本地(HTTP GET方式)他的目的是帮助NameNode 合并编辑日志,减少NameNode 启动时间。第10题
SQL时间函数
SQL语句 时间函数
分布式集群——搭建Hadoop环境以及相关的Hadoop介绍
本文主要介绍hadoop的相关概念以及在Linux上面配置Hadoop的具体操作。镜像文件实际是存放的目录结构、文件属性等相关信息,是NameNode中关于 元数据的镜像。它是在NameNode启动时对整个文件系统的快照。edits:编辑日志文件,记录对文件或者目录的修改信息,比如删除目录,修改文件
hadoop namenode -format报错显示:命令未找到
这个bug很搞笑,我做分布式搭建时,slaver1和slaver2都可以hadoop name -format,就是master不可以,配置都是一样的,这个第一时间也是想到了环境配置问题。这里的/apps/hadoop是我的hadoop安装路径(根据实际情况改动)然后再执行hadoop nameno
Hadoop PseudoDistributed Mode 伪分布式
上传本地测试文件 wcdata.txt 到 HDFS 上 /wordcount/input。浏览器访问:http://hadoop102:50090/浏览器访问:http://hadoop102:19888/在 HDFS 上创建目录 /wordcount/input。浏览器访问: http://ha
hive 动态分区-动态分区数量太多也会导致效率下降&只设置非严格模式也能执行动态分区
百亿数据动态分区处理
Hive On Spark 概述、安装配置、计算引擎更换、应用、异常解决
Hive On Spark 概述、安装配置、计算引擎更换、应用、异常解决
Spark Scala大数据编程实例
初步介绍scala,下载安装配置spark和scala,运行spark scala版本实例
Hive 的权限管理
hive自身支持三种权限管理模型,默认情况下是不开启的,这样会导致所有的用户都具有相同的权限,且默认都是超级管理员,超管对hive中的所有表都有查看和改动的权利,这样是不符合一般数据仓库的安全原则的,今天我们就来探究下Hive的权限管理
Hive 常用DML操作
1.加载文件数据到表1.1 语法LOCAL 关键字代表从本地文件系统加载文件,省略则代表从 HDFS 上加载文件:从本地文件系统加载文件时, `filepath` 可以是绝对路径也可以是相对路径 (建议使用绝对路径);从 HDFS 加载文件时候,`filepath` 为文件完整的 URL 地址:如
【Hadoop】MapReduce详解
MapReduce思想在生活中处处可见。MapReduce 的思想核心是“分而治之”,适用于大规模数据处理场景。Map负责“分”,即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的前提是这些小任务可以并行计算,彼此间几乎没有依赖关系。Reduce负责“合”,即对map阶段的结果进行全
hive的工作机制
hive的工作机制
【头歌】Hive内置函数 - 详解
【主要内容】函数的查询、描述和调用;Hive标准函数;Hive聚合函数;Hive日期函数;表生成函数;分组排序取TopN。【实践内容】编程实现HQL查询。
Hive表DDL操作(二) 第2关:Create/Drop/ALTER 索引
Hive表DDL操作(二)第2关:Create/Drop/ALTER 索引