大数据系列——什么是hdfs?hdfs用来干什么的?

大数据系列——什么是hdfs?hdfs用来干什么的?

python之lambda-filter-map-reduce作用

lambda:匿名函数,让函数更简洁,有时候妙用无穷;使用方法:lambda 后面直接跟变量,变脸后面是冒号,冒号后面是表达式,表达式的计算结果就是本函数的返回值注意:虽然 lambda 函数可以接收任意多的参数并且返回单个表达式的值,但是 lambda 函数不能包含命令且包含的表达式不能超过一个。

使用IDEA工具,通过Java API 操作 HDFS (文件/目录的操作,含源码,详细操作步骤)

Hadoop文件系统API文档:https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/filesystem/index.htmlHadoop整合了众多文件系统,HDFS只是这个文件系统的一个实例,下表整合了一些

linux安装Hadoop、hbase

首先按打开终端窗口,输入如下命令创建新用户接着使用如下命令设置密码,可简单设置为hadoop可为hadoop。

四十九、Hadoop HA部署(MINI版)

环境准备:编号 主机名 类型 用户 密码 1 master1-1 主节点 root passwd 2 slave1-1 从节点 root passwd 3 slave1-2 从节点 root passwd CentOS 7.4

大数据技术之SparkCore

Spark Core是spark的核心与基础,实现了Spark的基本功能,包含任务调度,内存管理,错误恢复与存储系统交互等模块Spark Core中包含了对Spark核心API——RDD API(弹性分布式数据集)的定义:RDD表示分布在多个计算节点上可以并行操作的元素集合,是spark的核心抽象。

强制退出hdfs安全模式

强制退出安全模式

CDH/CDP 是什么?

CDH ( Cloudera Distribution Hadoop )是 Cloudera 公司提供的包含 Apache Hadoop 及其相关项目的软件发行版本。CDP(Cloudera Data Platform)是 CDH 的继任者。CDP 是面向企业的云计算平台。

Hadoop 之 集群安装(HDFS、YARN)

Hadoop 之 集群安装(HDFS、YARN)

大数据编程期末大作业

学校大数据编程期末大作业(详细答案及解析),答案仅供参考。

impala中的刷新元数据和刷新表

refresh 命令是用于刷新某个表或者某个分区的数据信息,它会重用之前的表元数据,仅仅执行文件刷新操作,它能够检测到表中分区的增加和减少,主要用于表中元数据未修改,数据的修改,例如insert into(插入数据)、load data(加载数据)、alter table add partition

虚拟机ping主机和外网ping不通的解决办法

虚拟机ping主机和外网ping不通的解决办法和配置拷贝的centos的虚拟机

Shell脚本之——Hadoop3单机版安装

Shell脚本之——Hadoop3单机版安装

Hudi入门到实战

Hudi入门到实战

SparkSQL

大数据自学笔记——spark学习笔记

在 windows 构建 hadoop,生成 winutils.exe 和 hadoop.dll

windows 环境构建 hadoop,生成 winutils.exe 和 hadoop.dll

Hadoop分布式模式下SSH免密码登录

所以,需要安装SSH,但是,SSH远程登陆的时候,需要密码验证,集群中数千台计算机,数千台计算机都需要手工输入密码,这是不太现实的,所以,就需要配置SSH无密码登录。个客户端节点的公钥整合到~/.ssh/authorize_keys中,然后,用scp命令将 ~/.ssh/autorized_keys

大数据 | 实验一:大数据系统基本实验 | 常用的 Linux 操作和 Hadoop 操作

Hadoop 运行在 Linux 系统上,因此需要学习实践一些常用的 Linux 命令。

HBase集群部署

HBase要和hadoop的版本对应下载,否则做深层次任务会出问题。一、前期准备二、HBase下载1. 查看HBase与hadoop版本对应关系2. hbase的下载3. 将hbase的tar包上传到linux 下二、安装hbase1. 解压2. HBase的文件配置中还写的有一些内容,如果有的话删

IDEA 中使用 Big Data Tools 连接大数据组件

简介Big Data Tools 插件可用于 Intellij Idea 2019.2 及以后的版本。它提供了使用 Zeppelin,AWS S3,Spark,Google Cloud Storage,Minio,Linode,数字开放空间,Microsoft Azure 和 Hadoop 分布式文

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈