2023秋招——大数据研发工程师提前批一面
2023秋招百度提前批面经复盘,刚出炉,还是热乎的。
“凌波五步”解决报表没完没了
文末送五本《Spring Boot进阶原理、实战与面试题分析》
【大数据】搭建Hadoop集群(附一键部署脚本)
汝之观览,吾之幸也!本文主要讲解Hadoop运行环境的搭建(三台虚拟机),一键脚本部署,全自动化,不再需要按照文档一个一个进行配置,脚本执行后就可登录hadoop集群。
大数据项目车联网之项目基石与前瞻
车联网的概念介绍车联网( Internet of Vehicles )指按照一定的通信协议和数据交互标准,在““之间进行信息交换的网络。即首先实现汽车智能网联化,再利用各种传感技术,感知车辆状态信息,并借助无线通信网络与大数据分析技术实现交通的智能化管理。整体而言,车联网产业是汽车、电子、信息通信、
数据采集简介
简单介绍一下数据采集-数据采集简介
Flink系列02: FlinkCEP从源码开始学习(个体模式与模式组)
FlinkCEP从源码的角度去解析,第二期
flink技术总结待续
flink技术总结待续
超详细Hive总结!!!
超详细Hive总结!!!快来看
大数据ClickHouse(十五):ClickHouse SQL语法之DDL 操作讲解
DDL:Data Definition Language,数据库定义语言。在ClickHouse中,DDL语言中修改表结构仅支持Merge表引擎、Distributed表引擎及MergeTree家族的表引擎,SQL 中的库、表、字段严格区分大小写。
1.大数据从零基础到入坑的真实经历(学习路线)
大数据学习路线图——让自己系统学习,知道每一个阶段的学习内容
hadoop生态圈面试精华之Hadoop基础
hadoop生态圈面试精华之Hadoop基础
Elasticsearch:LDAP 用户鉴权
LDAP 全称为 Lightweight Directory Access Protocol, 轻量目录访问协议。简单地说, LDAP 就是用来访问目录数据库的一个协议。它成树状结构组织数据,类似文件目录一样它是为查询,浏览和搜索而优化的数据库,也就是说 LDAP 的可读性特别强,但是写性能差,而且
重磅发布 , 阿里云全链路数据湖开发治理解决方案
阿里云重磅发布全链路数据湖解决方案,主要包含开源大数据平台E-MapReduce(EMR) + 一站式大数据数据开发治理平台DataWorks + 数据湖构建DLF + 对象存储OSS等核心产品。
RDD的分区、依赖关系、机制
RDD的分区原则是分区的个数尽量等于集群中的CPU核心(Core)数目。各种模式下的默认分区数目如下(1) Local模式:默认为本地机器的CPU数目,若设置了local[N].则默认为N.(2) Standalone或者Yarn模式:在“集群中所有CPU核数总和"和“2”这两者中取较大值作为默认值
基于Echarts实现可视化数据大屏董事会指标体系层级结构系统
🚀 基于 Echarts 实现可视化数据大屏响应式展示效果的源码,,基于html+css+javascript+echarts制作, 可以在此基础上重新开发。本项目中使用的是echarts图表库,ECharts 提供了常规的折线图、柱状图、散点图、饼图、K线图,用于统计的盒形图,用于地理数据可视化
liunx:进程概念
liunx操作系统先利用task_ struct结构体保存进程的信息,再利用双链表的形式将他们组织起来,进行管理。
大数据Apache Druid(七):Druid数据的全量更新
提交任务后,稍等片刻,在“Segment”标签下找到“mydruid_testdata”Datasource,可以最终看到指定的时间范围“20210701T000000.000Z~20210702T000000.000Z”内,只有一个最后提交的Segment片段信息(开始可能会有2个,等一会只剩最新
大数据Apache Druid(八):Druid JDBC API和其他OLAP分析框架对比
在大数据处理场景中,我们可以编写接口来读取Druid中的数据进行聚合操作,以供可视化展示使用。下面使用jdbc的方式来读取Druid中的数据。(支持Segment批量覆盖更新)N(Kudu 引擎支持)
大数据场景下的AB-Test
想要了解 AB Test?不知道从哪里入手?Come on,I’am here!
【官方标准】- 交通运输领域元数据标准规范
官方交通运输领域元数据标准规范