大数据 - overfit.cn

Eureka与Zuul集成：实现微服务网关的最佳实践

Eureka是由Netflix开源的一个服务发现工具，它为微服务提供了一个服务注册和发现的中心。Eureka Server作为服务注册中心，负责维护所有注册服务的状态和元数据。服务实例通过Eureka Client向Eureka Server注册自己，并定期发送心跳以保持注册状态。Eureka Cl

overfit同步小助手 2024-08-30 19:03:37 0 收藏

Spark调优（一）Spark的特性与瓶颈

Spark作为一种高效的大数据处理框架，已经成为业界标准。其火爆程度源自其高速的数据处理能力和易用性。对Spark的调优尤为重要，可提高作业执行效率、降低资源消耗、优化内存利用和提高系统稳定性。调优涉及参数设置、数据倾斜处理、任务调度等多方面，直接影响作业性能。。

overfit同步小助手 2024-08-30 18:03:50 0 收藏

异常检测：基于自编码器的方法

异常检测：基于自编码器的方法1. 背景介绍异常检测是机器学习和数据挖掘领域的一个重要课题,在工业生产、金融风控、网络安全等诸多领域有着广泛的应用。异常是指数据集中与大多数数据点有显著差异的少数样本,通常表现为偏离正常模式或规律。异常检测的目的是从大量正常数据中识别出这些异常点,为后续的分析

overfit同步小助手 2024-08-30 18:03:19 0 收藏

数据仓库实战：详解维度建模事实表

overfit同步小助手 2024-08-30 17:03:51 0 收藏

在欧拉操作系统和OpenCloudOS上安装和配置 Docker

overfit同步小助手 2024-08-30 17:03:37 0 收藏

04 RabbitMQ：控制界面详解

overfit同步小助手 2024-08-30 15:03:41 0 收藏

VMware虚拟机中安装Kylin V10 银河麒麟操作系统

随着信息技术的飞速发展，自主可控的操作系统越来越受到重视。本文将介绍Kylin银河麒麟操作系统（简称银河麒麟或KylinOS）以及VMware虚拟机，并详细阐述如何在VMware虚拟机中安装Kylin银河麒麟操作系统。Kylin银河麒麟操作系统，作为中国自主研发的操作系统，旨在满足国家信息安全和自主

overfit同步小助手 2024-08-30 15:03:33 0 收藏

搭建Zookeeper单机运行环境

这些步骤成功搭建了一个单机环境下的Zookeeper服务，并实现对节点进行CRUD操作。的配置文件，该配置文件是zookeeper的核心配置文件，与zookeeper有关的几乎所有配置都要在此文件中进行定义。，它的主要作用是在某个路径中存储内存中的快照数据，将内存中的数据持久化到该路径中，以便在宕机

overfit同步小助手 2024-08-30 15:03:26 0 收藏

Hive的优化大全,超过16种优化,详细篇,附带mysql数据库的优化

hive的十六种优化的原理和代码; mysql的优化方式介绍

overfit同步小助手 2024-08-30 14:03:43 0 收藏

ZooKeeper 应用场景深度解析

✨✨🎈🎈作者主页：🎈🎈。

overfit同步小助手 2024-08-30 13:03:48 0 收藏

Flink 连接器 ClickHouse 教程

Flink 连接器 ClickHouse 教程 flink-connector-clickhouseFlink SQL connector for ClickHouse. Support ClickHouseCatalog and read/write primary data, maps, arr

overfit同步小助手 2024-08-30 13:03:31 0 收藏

Kafka的Offset（偏移量）详解

overfit同步小助手 2024-08-30 12:03:56 0 收藏

Kafka 中 Broker 与 Topic 的关系

Broker（代理）定义：Kafka Broker 是 Kafka 集群中的一个服务器节点，负责存储和处理消息数据。每个 Broker 可以独立运行，多个 Broker 组成一个 Kafka 集群。作用：Broker 接收生产者发送的消息，将其存储在磁盘上，并提供给消费者进行读取。Broker 还负

overfit同步小助手 2024-08-30 12:03:33 0 收藏

docker部署hadoop集群

docker部署hadoop集群；通过Dockerfile方式构建hadoop容器；hadoop职责划分为NameNode、DataNode、NodeManager、ResourceNode、2NN；HDFS、MapReduce、Yarn测试。

overfit同步小助手 2024-08-30 12:03:22 0 收藏

第十一章数据仓库和商务智能 10分

(1) 确定数据仓库/商务智能技术架构。(2) 确定数据仓库/商务智能管理流程。

overfit同步小助手 2024-08-30 11:03:35 0 收藏

大数据-103 Spark Streaming Kafka Offset管理详解 Scala自定义Offset

上节研究了Spark Streaming 与Kafka的关系，研究了08、10版本的不同的，研究了Producer、KafkaDStream，并且附带实例代码。在 DStream 初始化的时候，需要指定每个分区的Offsets用于从指定位置读取数据读取并处理消息处理完之后存储结果数据用虚线存储和提交

overfit同步小助手 2024-08-30 10:03:37 0 收藏

微服务健康检查：如何通过Eureka实现服务自动剔除与恢复

Eureka是Netflix开发的一个服务发现组件，属于Spring Cloud生态系统中的重要组成部分。Eureka主要有两个角色：Eureka Server和Eureka Client。：负责服务注册表的维护，所有Eureka客户端会向它注册自身服务并通过它发现其他服务。Eureka Serve

overfit同步小助手 2024-08-30 09:03:45 0 收藏

ZooKeeper 实战(六) - 分布式ID实现方案

比如本次生成的临时顺序节点的序号为0000000001，也就是1，但是在应用中，不认为这就是单纯的数字1，而是表示1份ID，这一份有100个ID，也可就是从100-199，即序号000000000100-000000000199。在100次ID的生成中，只有一次远程调用，大大提高了系统的并发性能，同

overfit同步小助手 2024-08-30 09:03:31 0 收藏

数据仓库系列8：如何设计一个高性能的数据仓库模型?

基于需求分析,我们可以确定以下核心事实表和维度表:销售事实表(Sales_Fact)客户行为事实表(Customer_Behavior_Fact)库存事实表(Inventory_Fact)时间维度(Time_Dim)产品维度(Product_Dim)客户维度(Customer_Dim)地理维度(Ge

overfit同步小助手 2024-08-30 09:03:17 0 收藏

大数据-106 Spark Graph X 计算学习案例：1图的基本计算、2连通图算法、3寻找相同的用户

上节研究了SparkGraphX基本概念、基础架构等内容，本节研究Spark GraphX的案例，放了3个案例，图的基本计算、连通图算法、寻找相同的用户。图本身是递归数据结构，顶点的属性依赖于它们的邻居的属性，这些邻居的属性又依赖于自己的邻居的属性。所以需要重要的算法都是迭代的重新计算每个顶点的属性

overfit同步小助手 2024-08-30 08:03:24 0 收藏