大数据 - overfit.cn

【flink番外篇】9、Flink Table API 支持的操作示例（5）- 表的列操作

系统介绍某一知识点，并辅以具体的示例进行说明。1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。3、Flik Table API和S

overfit同步小助手 2024-01-18 16:03:43 0 收藏

Spark SQL简介与基本用法

Spark SQL是Apache Spark的一个模块，用于处理结构化数据。它提供了一个高性能、分布式的SQL查询引擎，可以轻松处理各种数据源，包括结构化数据、半结构化数据和非结构化数据。Spark SQL的主要特点包括：支持SQL查询：您可以使用标准的SQL查询语言来查询和分析数据，无需编写复杂的

overfit同步小助手 2024-01-18 14:03:45 0 收藏

2023全国安全生产合格证其他生产经营单位主要负责人真题汇总

参考解析：《安全生产法》第20条生产经营单位应当具备的安全生产条件所必需的资金投入，由生产经营单位的决策机构、主要负责人或者个人经营的投资人予以保证，并对由于安全生产所必需的资金投入不足导致的后果承担责任。参考解析：《安全生产法》第20条生产经营单位应当具备的安全生产条件所必需的资金投入，由生产

overfit同步小助手 2024-01-18 12:07:14 0 收藏

mysql大数据高并发处理

一、数据库结构的设计如果不能设计一个合理的数据库模型，不仅会增加客户端和服务器段程序的编程和维护的难度，而且将会影响系统实际运行的性能。所以，在一个系统开始实施之前，完备的数据库模型的设计是必须的。在一个系统分析、设计阶段，因为数据量较小，负荷较低。我们往往只注意到功能的实现，而很难注意到性能的薄弱

overfit同步小助手 2024-01-18 11:03:25 0 收藏

数据仓库表级血缘应用

本文仅仅简单介绍了数据血缘在数仓中的一种应用场景。

overfit同步小助手 2024-01-18 11:03:09 0 收藏

【Spark基础】-- RDD 转 Dataframe 的三种方式

1、通过 StructType 创建 Dataframe（3、通过定义 schema 类创建 DataFrame。2、通过 RDD 推断创建 DataFrame （强烈推荐使用这种方法。

overfit同步小助手 2024-01-18 09:03:52 0 收藏

Docker 部署 Flink 集群环境

基于 Docker 部署 FLink 集群环境。

overfit同步小助手 2024-01-18 09:03:46 0 收藏

大数据-hive

hive是基于的一个工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供查询功能，能将转变成任务来执行。Hive的优点是学习成本低，可以通过类似SQL语句实现快速MapReduce统

overfit同步小助手 2024-01-18 08:03:49 0 收藏

Flink 窗口（1）—— 基础概念

本文介绍了Flink框架中窗口的基本概念

overfit同步小助手 2024-01-18 04:03:54 0 收藏

学生公寓里如何进行安全用电管理

想限制恶性负载，则需要首先辨别出恶性负载的特性，常见的学生公寓的用电负载类型为阻性负载（如白炽灯、电炉子、热的快、电钣煲、电热毯等）、感性负载（如日光灯，空调），容性负载（如风扇）、非线性负载（如计算机、充电器），以及它们混合时的负载。本平台适用于智能楼宇、高层公寓、宾馆、饭店、商厦、工矿企业、国家

overfit同步小助手 2024-01-18 01:07:15 0 收藏

flink sql1.18.0连接SASL_PLAINTEXT认证的kafka3.3.1

注意三个容器都映射了/opt/flink目录。docker-compose运行了一个jobmanager、一个taskmanager和一个sql-client。其次，username和password的双引号不需要写反斜杠，写反斜杠反而会报错。，分别放入上述三个文件夹的lib目录下。⑤后面的user

overfit同步小助手 2024-01-18 01:03:48 0 收藏

大数据之Docker学习笔记

-driver bridge 桥接网络--subnet 192.168.0.0/16 子网地址--gateway 192.168.0.1 网关地址。

overfit同步小助手 2024-01-18 00:03:50 0 收藏

Spark基础入门

sparkcore sparksql sparkstreaming structedstreming

overfit同步小助手 2024-01-17 22:03:50 0 收藏

Flink学习13-Flink CDC

cdc全称 Change Data Capture 变更数据捕获。通俗来讲只要能捕获到变更的数据的技术都可以称为cdc。常见的开源技术有以下几种：以下是几种技术的横向对比。

overfit同步小助手 2024-01-17 22:03:41 0 收藏

HiveSQL分区的作用及创建分区表案例演示(图解)

本篇文章主要介绍HiveSQL分区表的作用和如何创建单级分区表和多级分区表以及查询规则等.

overfit同步小助手 2024-01-17 19:03:33 0 收藏

使用hadoop进行词频统计测试案例

简单的使用hadoop进行词频统计处理

overfit同步小助手 2024-01-17 14:03:46 0 收藏

基于大数据的招聘数据分析与可视化实现（毕业设计爬虫大数据）

1. 数据收集与预处理：首先，需要构建一个完整的数据收集和预处理流程，确保数据的质量和可用性。4. 实际应用效果：通过实际应用，可以评估所提出的基于大数据的招聘数据分析与可视化实现方案的效果，包括提高招聘效率、降低招聘成本等方面。综上所述，基于大数据的招聘数据分析与可视化实现具有很强的实际需求、研究

overfit同步小助手 2024-01-17 14:03:33 0 收藏

Hadoop分布式文件系统(二)

文件系统是一种存储和组织数据的方法，实现了数据的存储、分级组织、访问和获取等操作，使得用户对文件访问和查找变得容易。文件系统使用树形目录的抽象逻辑概念代替了硬盘等物理设备使用数据块的概念，用户不必关心数据底层存在硬盘哪里，只需要记住这个文件的所属目录和文件名即可。文件系统通常使用硬盘和光盘这样的存储

overfit同步小助手 2024-01-17 14:03:20 0 收藏

FlinkAPI开发之数据合流

在实际应用中，我们经常会遇到来源不同的多条流，需要将它们的数据进行联合处理。所以Flink中合流的操作会更加普遍，对应的API也更加丰富。

overfit同步小助手 2024-01-17 13:03:48 0 收藏

【大数据优质案例】基于大数据分析的物流数据可视化平台

随着全球经济一体化和电子商务的快速发展，物流行业在现代社会中扮演着越来越重要的角色。物流数据可视化平台应运而生，旨在通过收集、分析和展示物流数据，帮助企业和政府部门更有效地监控和管理物流活动，提高物流效率，降低成本，实现可持续发展。国内外研究现状：国际上，许多国家和企业已经开始关注物流数据可视化技术

overfit同步小助手 2024-01-17 12:03:46 0 收藏