大数据 - overfit.cn

Kafka 之 KRaft —— 配置、存储工具、部署注意事项、缺失的特性

目前，Kafka 在使用的过程当中，会出现一些问题。由于重度依赖 Zookeeper 集群，当Zookeeper 集群性能发生抖动时，Kafka 的性能也会收到很大的影响。因此，在 Kafka 发展的过程当中，为了解决这个问题，提供 KRaft 模式，来取消 Kafka 对 Zookeeper 的依

overfit同步小助手 2024-09-02 09:03:37 0 收藏

大数据 (Big Data) 基础详解

尽管面临诸多挑战，但随着技术的不断发展和完善，大数据必将在未来发挥更大的作用，为社会带来更多的价值。例如，通过分析病患的电子病历和基因数据，可以制定个性化的治疗方案，提高治疗效果。例如，通过分析交易数据和社交媒体数据，可以实时监测市场变化，预测风险，防范金融欺诈。因此，确保数据的安全性是大数据技术应

overfit同步小助手 2024-09-02 08:03:46 0 收藏

【RabbitMQ】RabbitMQ持久化

RabbitMQ的持久化机制是一种确保数据在RabbitMQ服务重启或异常情况下不会丢失的重要特性。RabbitMQ的持久化主要包括三个方面的内容：交换器的持久化、队列的持久化、消息的持久化。

overfit同步小助手 2024-09-02 08:03:41 0 收藏

高性能存储 SIG 月度动态：优化 xfs dax reflink 时延，独立选型并维护 mdadm 和 ledmon

（PR3142/PR3144/PR3147）[Improment] 增加 XFS_IOC_SET_REFLINK_FLAGS 的检查条件，并导出 xfs_wait_reflink_secondary()。（PR3281/PR3285/PR3287）[Performance] 优化 xfs_log_f

overfit同步小助手 2024-09-02 06:03:40 0 收藏

windows下的zookeeper和kafka安装及配置

环境变量配置如下：在控制台cmd中输入zkServer，启动Zookeeper：管理员模式打开命令控制台，客户端连接zookeeper。输入zkCli输入ls /ls /点击下载scala2.12对应的压缩包:在kafka下载好的根目录下，创建新文件夹：kafka-logs编辑文件Kafka配置文件

overfit同步小助手 2024-09-02 06:03:37 0 收藏

ActorCritic 原理与代码实例讲解

Actor-Critic 原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming1. 背景介绍1.1 问题的由来在智能体（Agent）

overfit同步小助手 2024-09-02 06:03:25 0 收藏

Kafka Delta Ingest 使用教程

Kafka Delta Ingest 使用教程 kafka-delta-ingestdelta-io/kafka-delta-ingest: 是一个用于将数据从 Kafka 迁移到 Delta Lake 的工具。适合对大数据处理、数据湖以及想要使用 Kafka 和 Delta Lake 的开发者。项

overfit同步小助手 2024-09-02 04:03:48 0 收藏

【Linux】—Apache Hive 安装部署

本文主要介绍在Linux环境下安装Hive的过程。

overfit同步小助手 2024-09-02 04:03:31 0 收藏

Linux系统下虚拟机中安装（搭建）hive的详细教程

前面，我们已经在虚拟机中安装配置了linux，接下来我们将在虚拟机中安装hive。一、安装hive压缩包1、启动虚拟机①打开VMware、MobaXterm，启动虚拟机集群；②上传hive的tar压缩包至linux系统下目录（仍然为单节点安装，同样在第一台虚拟机上安装）2、安装hive①进入hi

overfit同步小助手 2024-09-02 03:03:31 0 收藏

Apache Flink Elasticsearch 连接器使用教程

Apache Flink Elasticsearch 连接器使用教程 flink-connector-elasticsearchApache Flink connector for ElasticSearch项目地址:https://gitcode.com/gh_mirrors/fli/flink-

overfit同步小助手 2024-09-02 03:03:26 0 收藏

从零开始大模型开发与微调：Nvidia 10_20_30_40系列显卡选择的GPU版本

从零开始大模型开发与微调：Nvidia GPU选择指南作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming关键词：大模型开发，GPU选择，Nvidia显卡，高性能计算，深度学习加速1. 背景

overfit同步小助手 2024-09-02 02:03:48 0 收藏

兔笼自动集群 - RabbitMQ Autocluster：简化消息队列管理的神器

兔笼自动集群 - RabbitMQ Autocluster：简化消息队列管理的神器 rabbitmq-autoclusterThis project is now maintained by the RabbitMQ Team, visit the official repo @项目地址:https

overfit同步小助手 2024-09-02 02:03:29 0 收藏

毕业设计项目基于大数据的游数据分析可视化系统(源码分享)

今天学长向大家分享一个毕业设计项目毕业设计基于大数据的游数据分析可视化系统(源码分享)演示效果毕业设计大同旅游数据分析可视化系统🧿 项目分享:见文末!数据可视化是数据处理中的重要部分Django是一个基于Web的应用框架，由python编写。Web开发的基础是B/S架构，它通过前后端配合，将后

overfit同步小助手 2024-09-02 01:03:41 0 收藏

Apache Flink Stateful Functions Docker 部署指南

Apache Flink Stateful Functions Docker 部署指南 flink-statefun-dockerDocker packaging for Apache Flink Stateful Functions项目地址:https://gitcode.com/gh_mirro

overfit同步小助手 2024-09-01 23:03:50 0 收藏

解决Ubuntu报“无法解析域名cn.archive.ubuntu.com“问题

今天在执行sudo apt update命令，弹出"无法解析域名cn.archive.ubuntu.com"错误。出现这种现象的原因: cn.archive.ubuntu.com这个网站的镜像资源不稳定，dns经常解析出错，需要在/etc/apt/sources.list文件，将archive.ub

overfit同步小助手 2024-09-01 23:03:28 0 收藏

基于云服务器ECS，快速部署Docker环境

2.1 运行以下命令，下载docker-ce的yum源。如下图回显信息所示，表示Docker已安装成功。执行以下命令，启动Docker服务，并设置开机自启动。2.2 运行以下命令，安装Docker。如下图回显所示，表示Docker已启动。执行以下命令，检查Docker是否安装成功。执行以下命令，查看

overfit同步小助手 2024-09-01 22:03:46 0 收藏

数据人，需要了解的数据要素、数据资产、数据治理、数据产品、数据共享、主数据、元数据

一文略讲数据要素、数据资产、数据治理、数据产品、数据共享、主数据、元数据

overfit同步小助手 2024-09-01 20:03:53 0 收藏

大数据基础：数仓架构演变

但是很快，他们也发现自己陷入了某种困境：随着数据集市的不断增多，这种架构的缺陷也逐步显现，公司内部独立建设的数据集市由于遵循不同的标准和建设原则，以致多个数据集市的数据混乱和不一致，解决以上问题，还需回归到范式建模。在Lambda架构中，为了计算一些实时指标，就在原来的离线数仓基础之上增加了一个实时

overfit同步小助手 2024-09-01 20:03:46 0 收藏

基于SpringBoot+Hadoop+python的物品租赁系统(带1w+文档)

物品租赁系统是电子、信息技术相结合，是一种必然的发展趋势。以互联网为基础，以服务于广大用户为目的，发展整体优势，扩大规模，提升服务质量，提高物品租赁的管理效率。物品租赁系统实现了物品租赁管理向现代化和网络化的转型，为管理决策和控制提供保障，这是物品租赁管理发展中里程碑式的转型。

overfit同步小助手 2024-09-01 20:03:34 0 收藏

Hadoop的HA配置与实现（ZooKeeper）

将112的tmp目录复制到113上（113为备用的主节点）和dfs.namenode.http-address.

overfit同步小助手 2024-09-01 19:03:35 0 收藏