大数据 - overfit.cn

大数据-46 Redis 持久化 RDB AOF 配置参数混合模式具体原理触发方式优点与缺点

上节Redis持久化概念介绍，RDB和AOF对比。本节配置RDB、AOF参数，运行原理，混合模式、两者的优点和缺点。Redis 加了一个 AOF 缓存，这个缓存在Fork出子进程之后，Redis主进程接收到新的写命令时，除了会将这个命令追加到现有的AOF文件，还会。RDB（Redis DataBas

overfit同步小助手 2024-08-28 09:03:51 0 收藏

开源数据仓库对比

随着大数据时代的到来，企业对高效、可扩展的数据存储和分析需求日益增长。开源数据仓库技术因其灵活性、成本效益和强大的社区支持而受到广泛欢迎。本文将对比分析几款主流的开源数据仓库解决方案，包括Apache Hadoop Hive、Apache Spark SQL、ClickHouse、Greenplum

overfit同步小助手 2024-08-28 09:03:25 0 收藏

为什么客户选择 Elastic 来处理日志？

Elastic 正在改变日志体验以满足现代工作流程的需求。在没有其他可观察性信号的情况下，通常基础设施（硬件、软件和服务）中的所有内容都会发出日志行。然而，日志通常是根据开发人员的想法构建的，并且首先是为了满足开发人员的需求（例如调试）。一旦投入生产，这些相同的日志行就会被提升为观察应用程序和基础设

overfit同步小助手 2024-08-28 08:03:52 0 收藏

[个人感悟] 消息队列应该考察哪些问题?

消息队列. 不论是Java内部提供的LinkedBlockingQueue, 还是当下主流的中间件RabbitMQ, Kafka, RockMQ. 其本质上都是一个削峰填谷的工具.我们都知道, 请求和流量都有可能瞬间很高, 或者很低. 所以, 很多时候, 我们需要请求存储起来, 或者使用异步的方式,

overfit同步小助手 2024-08-28 07:03:49 0 收藏

Vulhub 靶场搭建使用

Vulhub是一个基于docker和的漏洞环境集合，进入对应目录并执行一条语句即可启动一个全新的漏洞环境，让漏洞复现变得更加简单，让安全研究者更加专注于漏洞原理本身1.下载docker：sudo vim /etc/apt/sources.list #更新源2.下载docker-compose：使用二

overfit同步小助手 2024-08-28 07:03:39 0 收藏

深入Eureka源码分析工作原理及实践案例

Eureka是Netflix开源的一个服务注册与发现框架，广泛应用于微服务架构中。它通过提供服务的自动注册与发现机制，简化了服务间的依赖管理，提高了系统的灵活性和可扩展性。Eureka主要由Eureka Server（服务注册中心）和Eureka Client（服务实例）两个核心组件组成。下面将详细

overfit同步小助手 2024-08-28 07:03:32 0 收藏

Flink开发语言使用Java还是Scala合适?

在讨论Apache Flink开发时选择Java还是Scala作为开发语言，我们需要深入探讨这两种语言在Flink生态系统中的适用性、它们各自的优缺点、对开发效率的影响、以及它们如何与Flink的核心功能和架构相结合。以下是对这一问题的详细分析，旨在帮助开发者在决策过程中做出更加明智的选择。

overfit同步小助手 2024-08-28 07:03:24 0 收藏

【2024.7.18】数据中台知识体系

来数据仓库的主要场景是支持管理决策和业务分析，而数据中台则是将数据服务化之后提供给业务系统，目标是将数据能力渗透到各个业务环节，不限于决策分析类场景。数据中台持续不断地将数据进行资产化、价值化并应用到业务，而且关注数据价值的运营。数据中台建设包含数据体系建设，也就是数据中台包含数据仓库的完整内容，数

overfit同步小助手 2024-08-28 06:03:40 0 收藏

Yarn原理与代码实例讲解

Yarn原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming1. 背景介绍1.1 问题的由来随着云计算和大数据技术的快速发展，分布式计算已经成为现代I

overfit同步小助手 2024-08-28 05:03:53 0 收藏

使用住宅代理抓取奥运奖牌新闻，全面掌握赛事精彩瞬间

无论是为了实时跟踪奥运奖牌新闻，还是为了更好地分析体育发展趋势，新闻抓取都是一种强大的工具。随着技术的发展，新闻抓取的应用范围将会越来越广，尤其是在涉及到全球重大事件时，能够迅速、全面地掌握第一手资讯，将成为你在竞争中脱颖而出的关键。而使用住宅代理，更是为这一过程增添了一层保障，确保你能够稳定、顺畅

overfit同步小助手 2024-08-28 05:03:43 0 收藏

hadoop学习系列--环境安装

value>hdfs://127.0.0.1:9000</value> //如果其他主机也要访问，那就将127.0.0.1:9000改为：你的网卡IP：9000，或者改为0.0.0.0:9000。先说踩的坑：刚开始学习，使用mac本安装单机hadoop，遭遇mac自身安全限

overfit同步小助手 2024-08-28 05:03:39 0 收藏

性能测试之中间件：什么是 kafka 和 MQ ？

kafka的诞生，是为了解决linkedin的数据管道问题，起初linkedin采用了ActiveMQ来进行数据交换，大约是在2010年前后，那时的ActiveMQ还远远无法满足linkedin对数据传递系统的要求，经常由于各种缺陷而导致消息阻塞或者服务无法正常访问，为了能够解决这个问题，linke

overfit同步小助手 2024-08-28 05:03:32 0 收藏

RabbitMQ 应用

和发布 / 订阅模式不同的是，队列和交换机的绑定，不能是任意绑定了，而是要指定一个 BindingKey（RoutingKey 的一种），消息的发送方向 Exchange 发送消息时，也需要指定消息的 RoutingKey，交换机需要根据消息的 RoutingKey 进行判断，只有队列绑定时的 Bi

overfit同步小助手 2024-08-28 04:03:51 0 收藏

大数据产业链图谱_产业链全景图_大数据行业市场分析

大数据产业链上游为基础支持层，包括数据源、数据采集、底层技术、数据安全等环节，中游为数据处理层，包括数据分析、数据挖掘、数据可视化等环节，下游主要为行业应用、解决方案及通用产品。

overfit同步小助手 2024-08-28 03:04:03 0 收藏

一文读懂古瑞瓦特全场景PCS及能管解决方案

古瑞瓦特除了可提供全场景的PCS产品以外，还可提供成熟，稳定，免费的智慧能管解决方案，单设备监控采用的WiFi，4G，LAN和WiLAN采集器可以灵活选择，多设备监控采用的GroHome Manager，Shine Link-X，Shine SEM-X能管设备也可依据应用场景进行选择，同时配套有成熟

overfit同步小助手 2024-08-28 03:03:58 0 收藏

Hadoop简明教程

Hadoop极简教程

overfit同步小助手 2024-08-28 03:03:53 0 收藏

SpingBoot集成kafka-发送读取消息示例

SpingBoot集成kafka发送读取消息

overfit同步小助手 2024-08-28 03:03:46 0 收藏

大数据与大模型技术赋能：革新智能客服系统知识库管理的策略与实践

大数据与大模型技术的融合正在推动智能客服系统的革新。这些技术通过提供更智能、个性化和高效的服务，正在改变用户与企业之间的互动模式。随着技术的不断发展，这些技术在智能客服系统中的应用前景是充满希望的。企业应积极探索这些技术的应用，不断提升客服系统的性能，以在竞争激烈的市场中获得优势，并为用户提供更优质

overfit同步小助手 2024-08-28 03:03:37 0 收藏

Hive-3.1.3远程模式安装与配置

Hive-3.1.3的安装与配置

overfit同步小助手 2024-08-28 03:03:23 0 收藏

web渗透测试漏洞复现：ZooKeeper未授权漏洞复现

ZooKeeper 是一个分布式的、开源的协调服务，最初由雅虎开发，现隶属于 Apache 软件基金会，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件，旨在为大型分布式系统提供一致性的服务。ZooKeeper 的设计目的是简化分布式应用程序的开发和维护，它通过提供一

overfit同步小助手 2024-08-28 02:03:50 0 收藏