【任务调度】Apache DolphinScheduler中关于全局参数设置、自定义参数、补数的介绍
海豚调度DolphinScheduler中关于全局参数设置、自定义参数、补数的介绍
集成Apache Kylin与Apache Hadoop:实现大数据高效分析
Apache Kylin是一个开源的分布式分析引擎,能够提供Hadoop之上的多维分析(OLAP)能力。Kylin通过预计算存储多维立方体(Cubes)来加速查询速度,能够在数秒内完成对TB级数据的查询。支持多维分析和OLAP查询。高效的查询速度,适用于大数据环境。与Hadoop生态系统的紧密集成,
Apache Spark:SparkGraphX图数据处理技术教程
SparkGraphX 是 Apache Spark 中用于图数据处理和图算法执行的模块。它提供了高效、灵活的图并行计算框架,适用于大规模图数据集的分析。通过理解 SparkGraphX 的核心概念和算法,你可以开始在你的大数据项目中应用图计算技术。请注意,上述代码示例和配置假设你已经熟悉 Spar
vulhub:Apache解析漏洞CVE-2017-15715
vulhub漏洞复现:Apache解析漏洞CVE-2017-15715
Apache Hadoop完全分布式集群搭建指南
本文主要使用centos7搭建apache hadoop完全分布式集群,详细介绍了Hadoop集群搭建、配置,Hadoop集群配置 = HDFS集群配置 + MapReduce集群配置 + Yarn集群配置。另外介绍了hadoop集群单节点启动或集群批量启动脚本的使用。搭建完毕将启动HDFS的3节点
计算效率提升 30 倍、存储资源节省 90%,雨润集团基于 Apache Doris 的统一实时数据仓库建设实践
作者:石公星,雨润集团基础数据平台架构师导读:数字化转型的浪潮中,高效准确的数据分析能够帮助雨润集团快速洞察市场动态、优化供应链管理、提高生产效率。雨润集团引入了 Apache Doris 构建了统一实时数据仓库,实现了计算效率提升 30 倍、存储资源节省 90%、成本降低超 100 万、人员效率提
开源网关Apache APISIX启用JWT身份验证
开源网关Apache APISIX启用JWT身份验证
本地网页的发布第一篇:Apache的下载与安装(Windows版本)
首先,了解一下什么是Apache。Apache HTTP Server(简称Apache)是Apache软件基金会的一个开放源码的网页服务器,可以在大多数计算机操作系统中运行,由于其多平台和安全性被广泛使用,是最流行的Web服务器端软件之一。它快速、可靠并且可通过简单的API扩展,将Perl/Pyt
【踩坑日常】Linux配置Apache转发https请求到tomcat
配置apache和tomcat的ssl证书apache新增80端口、443端口的转发监听,443端口需要增加ssl代理配置。
消息队列选型指南:轻松理解常见消息队列和框架(RabbitMQ、ActiveMQ、Apache Kafka)
选择消息队列就像是为你的企业选择一个合适的物流系统。你需要考虑货物的类型(消息的性质)、运输的距离(消息的延迟要求)、运输的成本(系统的成本),以及是否需要跟踪货物(消息的持久化需求)等因素。每种消息队列都有其特点和适用场景,没有绝对的“最好”选择,只有最适合你当前需求的选择。
Apache-Flink未授权访问高危漏洞修复
由于flink没有鉴权的设置,使用使用 htpasswd 工具+服务器系统防火墙设置,才能禁用默认对外访问的8081端口,使用用户名+密码实现安全验证登录flink web ui。
安装Apache Flink的步骤
以上就是下载并安装Apache Flink的详细步骤。
Spark SQL 的总体工作流程
Spark SQL 结合了 SQL 的易用性和 Spark 的分布式计算能力,通过优化查询计划和内存管理,为大规模数据处理提供了一个强大、灵活且高效的解决方案。
Flink CDC:基于 Apache Flink 的流式数据集成框架
Flink CDC 最早的发展就始于 GitHub 开源社区。自 2020 年 7 月开始,项目在 Ververica 公司的 GitHub 仓库下以 Apache 2.0 协议开放源代码。并提供了从主流 MySQL 和 PG SQL 数据库中捕获变化数据的能力。2.0 版本引入了运行更高效、更稳定
深入探索Apache ZooKeeper:关键技术学习与实践指南
深入学习ZooKeeper不仅需要理解其分布式一致性原理、数据模型与API,还需掌握集群架构、会话管理、Watcher机制以及在实际场景中的应用。同时,重视监控与运维、安全与权限管理,确保ZooKeeper在生产环境中稳定、高效、安全地运行。通过理论学习与实践操作相结合,读者将能全面驾驭这一强大的分
当Excel处理神器EasyExcel遇上Apache POI:一场关于依赖的趣味‘撞车’冒险
这里是Blue,今天我写代码遇到了一个这样的问题,我在使用easyexcel的时候它无法去执行我的操作,通过我一定的判断最终解决了问题。
【Apache Doris】周FAQ集锦:第 9 期
【Apache Doris】周FAQ集锦:第 9 期
Linux重要知识点
Linux大多数操作都是通过命令行进行的。熟悉常用命令和脚本是使用Linux的基础。管理Linux系统包括监控系统资源、管理用户账户、配置服务等。了解不同类型的文件系统,学习如何格式化、挂载、备份和恢复数据。配置和管理网络是Linux系统管理员的一项重要任务。Linux使用包管理器来安装、更新和管理
【大数据离线项目四:什么是海豚调度?怎么使用可以将海豚调度应用到我们的大数据项目开发中?】
Apache DolphinScheduler(海豚调度)是一个分布式、去中心化、易扩展的可视化DAG工作流任务调度系统,致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。Apache DolphinScheduler 旨在解决复杂的大数据任务依赖关系,并为应用程序提供
认识流式处理框架Apache Flink
Apache Flink 是一个框架和分布式处理引擎,用于在 无边界 和 有边界 数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。近年来Apache Flink计算框架发展迅速,Flink以流处理为基础,对批数据也有很好的支持,尤其是在流计算领域相