apache - overfit.cn

大数据-159 Apache Kylin 构建Cube 准备和测试数据

Apache Kylin 是一个开源的分布式分析引擎，专注于提供大数据的实时OLAP（在线分析处理）能力。Cube（立方体）是 Apache Kylin 的核心概念之一，通过预计算大规模数据的多维数据集合，加速复杂的 SQL 查询。

overfit同步小助手 2024-10-11 18:03:27 0 收藏

大数据-158 Apache Kylin 安装配置详解集群模式启动

需要注意：要求HBase的hbase.zookeeper.quorum值必须只能是 host1、host2这种，不允许host1:2181、host2:2181这种。你可以通过wegt或者本地下载完传到服务器上，按照需求，我这里是上传到 h122 节点上。修改完的结果为如下：（这里我暂时注释了，防止

overfit同步小助手 2024-10-11 13:03:47 0 收藏

大数据-160 Apache Kylin 构建Cube 按照日期构建Cube 详细记录

Apache Kylin 是一个开源的分布式分析引擎，专注于提供大数据的实时OLAP（在线分析处理）能力。Cube（立方体）是 Apache Kylin 的核心概念之一，通过预计算大规模数据的多维数据集合，加速复杂的 SQL 查询。

overfit同步小助手 2024-10-11 09:03:41 0 收藏

Java 与 Apache Spark 集成：打造数据处理的超级英雄

Apache Spark 是一个开源的大规模数据处理框架，它提供了一个统一的编程模型，用于执行批处理、流处理、机器学习和图形处理等任务。Spark 的核心优势在于它的速度和易用性。由于 Spark 的 Java API 不像 Scala API 那样提供了方便的元组类型，我们需要自定义一个Pair类

overfit同步小助手 2024-10-08 19:03:50 0 收藏

【安全漏洞】Apache Tomcat 高危漏洞版本

Apache Tomcat 高危漏洞版本

overfit同步小助手 2024-10-07 23:06:33 0 收藏

Web 日志分析工具 awstats

installconfigureorapacheweb 测试。

overfit同步小助手 2024-10-07 00:03:09 0 收藏

Apache Flink 流批融合技术介绍

本文整理自阿里云高级研发工程师、Apache Flink Contributor 周云峰老师在 Apache Asia CommunityOverCode 2024中的分享。

overfit同步小助手 2024-10-05 21:03:16 0 收藏

Apache Spark: 大规模数据处理的统一分析引擎

Apache Spark是一个用于大规模数据处理的开源统一分析引擎,由加州大学伯克利分校AMPLab开发并于2010年开源。作为一个通用的大数据处理平台,Spark提供了高性能的内存计算能力和丰富的数据处理API,支持批处理、流处理、机器学习、图计算等多种应用场景。自开源以来,Spark迅速成为大数

overfit同步小助手 2024-10-05 13:03:57 0 收藏

在CentOS 7上安装Apache Web服务器的方法

Apache HTTP 服务器是世界上使用最广泛的 Web 服务器。它提供许多强大的功能，包括动态加载模块、强大的媒体支持以及与其他流行软件的广泛集成。在本指南中，您将在 CentOS 7 服务器上安装一个带有虚拟主机的 Apache Web 服务器。

overfit同步小助手 2024-10-05 11:06:08 0 收藏

EC Shop安装指南 [ Apache PHP Mysql ]

这个是软件测试课上老师布置的一个作业，期间老师也出现了不少错误，所以还是有必要记录一下吧，凑一篇文章主要是老师的文档以及自己的一些尝试记录，试错记录，解决方案等主要介绍了Apache的安装，MySQL的安装、PHP的安装、ECShop安装，以及安装过程中出现的错误分析解决方案。

overfit同步小助手 2024-10-05 05:07:00 0 收藏

分布式流处理平台（Apache Kafka）

Apache Kafka：分布式流处理平台，可用于实时数据集成和流数据处理。支持高吞吐量的数据传输和处理，适用于实时数据分析和事件驱动架构。最初由LinkedIn开发并开源，于2011年开始投入使用，后来成为Apache软件基金会的一个顶级项目。其设计初衷是为了满足LinkedIn公司内部对大规模实

overfit同步小助手 2024-10-04 20:04:19 0 收藏

大数据-153 Apache Druid 案例从 Kafka 中加载数据并分析

Apache Druid 从 Kafka 中获取数据并进行分析的流程通常分为以下几个步骤：Kafka 数据流的接入： Druid 通过 Kafka Indexing Service 直接从 Kafka 中摄取实时流数据。Kafka 是一个高吞吐量的消息队列，适合处理大量实时数据。Druid 会订阅

overfit同步小助手 2024-10-04 04:03:16 0 收藏

大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计

Apache Druid 是一个高效的实时数据存储和分析系统，结合 Kafka 能实现对实时流数据的摄取与处理。典型的流程是先通过 Kafka 采集数据，Kafka 作为数据源接收生产者发送的实时数据，比如用户行为日志或传感器数据。Druid 通过 Kafka Indexing Service 实时

overfit同步小助手 2024-10-04 01:03:38 0 收藏

大数据-155 Apache Druid 架构与原理详解数据存储索引服务压缩机制

Segment创建完成之后，Segment文件就是不可更改的，被写入到深度存储（目的是为了防止MiddleManager节点宕机后，Segment丢失）。负责创建Task、分发Task到MiddleManger上运行，为Task创建锁以及跟踪Task运行状态并反馈给用户。同时，Metadata st

overfit同步小助手 2024-10-03 15:03:59 0 收藏

大数据-151 Apache Druid 集群模式配置启动【上篇】超详细！

Apache Druid 集群模式配置启动【上篇】超详细！将MySQL驱动链接到：$DRUID_HOME/extensions/mysql-metadata-storage 中。上述文件链接到 conf/druid/cluster/_common 下。参数大小根据实际情况调整。参数大小根据实际情

overfit同步小助手 2024-10-02 16:06:41 0 收藏

大数据学习｜理解和对比 Apache Hive 和 Apache Iceberg

Hive是一个成熟的数据仓库解决方案，特别适合于批处理和数据仓库应用。Iceberg是一个更为现代的数据表格式，提供了更强的事务支持和性能优化，适用于需要更灵活数据管理和实时处理的应用场景。选择 Hive 还是 Iceberg 取决于具体的业务需求和技术背景。如果你的应用需要支持事务处理和更高的读写

overfit同步小助手 2024-10-02 15:03:57 0 收藏

大数据-149 Apache Druid 基本介绍技术特点应用场景

使用Hadoop、Spark进行分析将Hadoop、Spark的结果导入到RDBMS中提供数据分析将结果保存到容量更大的NoSQL数据库中，解决数据分析的存储瓶颈，例如：HBase将数据源进行流式处理，对接流式计算框架（如Storm、Spark、Flink），结果保存到RDBMS或NoSQL中将数据

overfit同步小助手 2024-10-02 01:03:31 0 收藏

大数据-152 Apache Druid 集群模式配置启动【下篇】超详细！

Apache Druid 是一种高性能、分布式的列式存储数据库，专门用于实时分析和查询大规模数据集。它适用于 OLAP（在线分析处理）场景，尤其在处理大数据实时流时表现优异。Druid 的架构由多个组件组成，主要包括数据摄取、存储、查询和管理。数据摄取层：使用 MiddleManager 节点来处理

overfit同步小助手 2024-10-01 18:03:12 0 收藏

Apache OFBiz 远程代码执行漏洞复现(CVE-2024-45195)

2024年9月，互联网上披露了Apache OFBiz 远程代码执行漏洞(CVE-2024-45195)，该漏洞允许未经身份验证的远程攻击者通过SSRF漏洞控制请求从而写入恶意文件。攻击者可能利用该漏洞来执行恶意操作，包括但不限于获取敏感信息、修改数据或执行系统命令，最终可导致服务器失陷。

overfit同步小助手 2024-10-01 15:06:37 0 收藏

大数据-154 Apache Druid 架构与原理详解基础架构、架构演进

Coordinator是周期运行的（由 druid.coordinator.period 配置指定，默认间隔60秒），Coordinator需要维护和ZooKeeper的连接，以获取集群的信息。进程监视MiddleManager进程，并且是Druid数据摄入的主节点，负责将提取任务分配给Middle

overfit同步小助手 2024-10-01 10:02:31 0 收藏