大数据面试小抄

流式大数据处理引擎内存执行速度 -> 速度快任意规模 -> 可扩展性强高吞吐、低延迟:每秒处理数百万个事件,毫秒级延迟结果的准确性:提供事件事件、处理时间语义。对于乱序事件流仍然能提供一致且准确的结果exactle-once状态一致性保证高可用:本身高可用的设置,加上与K8s、YARN、Mesos的

监管数据治理治什么?1104、EAST、客户风险系统数据简介

1104、EAST、客户风险系统数据简介

Elasticsearch RestHighLevelClient API 使用总结

Elasticsearch RestHighLevelClient API 使用总结

西恩科技更新招股书:IPO前大手笔分红“套现”, 赵志安为实控人

就产品类型来看,西恩科技的收入主要由硫酸镍、三元前驱体、碳酸锂等贡献,其中硫酸镍的占比最高。报告期内,西恩科技来自硫酸镍的收入分别为3.83亿元、4.33亿元、7.47亿元和4.98亿元,占主营业务收入的比例分别为80.19%、57.10%、49.22%和46.60%。报告期内,西恩科技的前五大客户

Hive详解(超详细)

hive详解

Hbase命令行语句

语法:desc ‘表格名’语法:create ‘表格名’,‘列族名1’,‘列族名2’,‘列族名n’语法:disable ‘表格名’语法:enable ‘表格名’语法:scan ‘表格名’语法:id_disabled ‘表格名’语法:disable_all ‘条件’语法:enable_all ‘条件’

Spark 的学习笔记

Apache Spark 是一个快速的,多用途的集群计算系统。它提供了 Java,Scala,Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎,它还支持一组丰富的高级工具,包括使用 SQL 处理结构化数据的 Spark SQL,用于机器学习的 MLlib,用于图计算的

Hive的安装与配置——第1关:Hive的安装与配置

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ysxGddek-1666195111052)(D:\文件\大三上\大数据库\educoder_Hive的安装.png)]版本就说明安装成功,但是可以看到其中有一些警告信息,是由于包的冲突引起的。补充完代码后,点击测评,平台

OpenStack简介 | 常见的基础组件

OpenStack是由美国国家航空航天局NASA)与Rackspace公司合作研发并发起的,以Apache许可证授权的自由软件和开放源代码的云计算技术解决方案,其是一个项目也是一个软件,主要用于实现云项目,以云项目操作系统而存在。作用: 用于部署公有云、私有云,并实现对云项目管理。

20天学习Spark(1)之Spark UI的使用

Spark UI的使用方式

Android 系统的分区

1.modem分区,主要是手机短信的通讯模块;2.bootloader分区,主要用于线刷;3.recovery分区,只有用于普通刷机;4.boot分区,用于启动;5.system分区,系统分区;6.data分区,用户分区;7.cache分区:存储使用过程中的缓存数据8.vendor:包含有厂商私有的

sparksql 读取hive表子目录问题排查

sparksql读取hive表子目录问题

Flink1.14 connector-jdbc插入更新(Upsert)模式的源码解析

基于flink jdbc方言(dialect)里不同Statement何时、如何被调用的思考。前言:在修改flink-connector-jdbc源码时,观察到jdbc有方言的实现,在 JdbcDialect.class 里存在insert/update和upsert两种更新语义,所以研究下何种情况

高校学生就业管理系统

数据库课设

docker、docker-compose部署elasticsearch集群

使用docker-compose部署elasticsearch集群,在开发学习环境中使用

JDBC进行批量插入数据操作

通过逐层优化的方式来介绍如何向数据库进行批量插入

大数据理论体系

目录结构大数据是什么?大数据是如何发展起来的?大数据处理的基本流程是什么?为什么说数据不动代码动?移动计算比移动数据更划算?DAG对大数据处理有什么好处?批处理和流处理如何区分? 有边界数据和无边界数据如何区分?批处理中如何提高CPU利用率?什么是事件时间和处理时间?Workflow设计模式指的什么

filebeat同时采集多个日志时,logstash和filebeat的文件配置

filebeat同时采集多个日志时,logstash和filebeat的文件配置

Spark的基本概念与架构

Spark的基本概念与架构

HDFS高可用配置及其高可用集群搭建

HDFS的HA(高可用)的背景、造成故障的原因以及解决方案,同时介绍了HA的解决方案-QJM 并详细记录了HA集群搭建的过程

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈