大数据工程专业技术证书考试-数据分析与应用

数据分析与应用根据大纲整理

[spark]spark资源分配

(1*4即4个节点共4个executor)*4=16,总cpu为32线程 8/16=1/2。每个executor内存数=该节点可用的总内存数/该节点executor数=16G/1=19G(这里因为executor num实在太小,所以随便选了16)但是一般cpu:内存=1:2-1:4,阿里云封装的时

一百一十三、DBeaver——从hive同步数据到clickhouse

DBeaver——从hive同步数据到clickhouse

Flink作业任务的9种状态简单介绍

当创建一个Flink任务后,该任务可能会经历多种状态。目前Flink给任务共定义了9种状态,包括:`Created`,`Running`,`Finished`,`Cancelling`,`Canceled`,`Restarting`,`Failing`,`Failed`,`Suspended`。

大数据开发之windows安装hadoop教程

本文主要介绍如何在windows上安装hadoop

Hive ---- 文件格式和压缩

为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器,如下表所示:Hadoop查看支持压缩的方式hadoop checknative。Hadoop在driver端设置压缩。

Hadoop

CentOS下Hadoop的安装和配置,有问题欢迎大家评论区交流!!!

百万级sql server数据库优化案例分享

在我们的IT职业生涯中,能有一次百万级的数据库的优化经历是很难得的,如果你遇到了恭喜你,你的职业生涯将会更加完美,如果你遇到并解决了,那么一定足够你炫耀很多年。这里我将要分享一次完美的百万级数据库优化经历,希望能给在IT行业的小伙伴一点启发和帮助。本篇分三步走:1、遇到问题;2、分析问题;3、解决问

Prometheus实战教程:监控Kafka消息

使用prometheus+Grafana+kafka_exporter+kafka实现监控Kafka运行状态

ES_深度分页概念与解决方案

Es深度分页概念与解决方案

[选型] 实时数仓之技术选型

关于实时数仓的选型● 如果选择hbase,建议选择kudu● 如果选择kudu, 还可以选择doris● 如果选择doris,建议选择iceberg

Flink Web UI不能访问

Flink Web UI无法正常访问排查过程

HIVE基础-文件存储格式

对 HIVE 文件四种主要存储格式(textfile、sequencefile、orc、parquet)进行详细介绍

Hadoop和Hbase版本对应关系(参考官网)

Hadoop和Hbase版本对应关系(参考官网)

Flink将数据写入CSV文件后文件中没有数据

Flink中writeAsCsv方法源码解析

【ES】windows启动

es在windows启动时会遇到的一些坑

Kafka的ack机制

Kafka的ACK机制,指的是producer的消息发送确认机制,这直接影响到Kafka集群的吞吐量和消息可靠性。而吞吐量和可靠性就像硬币的两面,两者不可兼得,只能平衡。Kafka的ACK机制是针对producer的。保证消息的吞吐量就是producer只负责发数据,不需要得知消息是否被集群接收,这

【Shell-HDFS】使用Shell脚本判断HDFS文件、目录是否存在

【Shell-HDFS】使用Shell脚本判断HDFS文件、目录是否存在

【GPT模型】遥感云大数据在灾害、水体与湿地领域中的应用

遥感技术、GPT模型、灾害、水体、湿地、海量遥感数据处理、GEE、卫星遥感大数据、ENVI、气候变化、遥感、遥感影像

大数据公司数据分析取数流程以及SQL示例

有效的数据分析,首先需要从庞大的数据库中获取所需的数据,这就涉及到SQL取数的技巧。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈