大数据 - overfit.cn

Navicat Premium 17.1.3版本发布，原生支持华为云数据仓库GaussDB(DWS)

近日，Navicat发布了一项重要更新，原生支持华为云数据仓库GaussDB(DWS)。这是Navicat支持的国内首个数据仓库产品，将为广大GaussDB(DWS)用户带来更多的便利。

overfit同步小助手 2024-10-24 15:03:47 0 收藏

RabbitMQ C#实践：测试代码、使用示例及系统扩展与集群配置方法

本文还有配套的精品资源，点击获取简介：RabbitMQ是一款开源的消息队列系统，基于AMQP协议，以高可用性、可扩展性和可靠性著称。本内容提供C#环境下与RabbitMQ交互的测试代码和使用示例，涵盖系统扩展和集群配置的详细步骤。首先介绍RabbitMQ的基本概念，包括生产者、消费者、交换器和

overfit同步小助手 2024-10-24 15:03:20 0 收藏

zookeeper

Zookeeper是一个开源的分布式的，为分布式框架提供协调服务的Apache项目。外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传Zookeeper工作机制Zookeeper从设计模式角度来理解：是一个基于观察者模式设计的分布式服务管理框架，他负责存储和管理大家都关系的数据，然后

overfit同步小助手 2024-10-24 14:07:09 0 收藏

消息队列10：为RabbitMq添加连接池

【代码】消息队列10：为RabbitMq添加连接池。

overfit同步小助手 2024-10-24 14:06:56 0 收藏

week08 zookeeper多种安装与pandas数据变换操作-new

本文是第8周的hadoop与数据导入预处理课程，包括zookeeper的安装与基于pandas的数据变换操作，并提供了sql窗口函数的说明

overfit同步小助手 2024-10-24 14:06:37 0 收藏

毕业设计项目 python大数据旅游数据分析可视化系统(源码分享)

🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是🚩 **基于python的旅游数据分析可视

overfit同步小助手 2024-10-24 13:03:43 0 收藏

Kafka Topic原理与代码实例讲解

本文将深入探讨Kafka Topic的原理，通过详细的代码实例，帮助读者理解Kafka Topic在分布式系统和消息队列中的核心作用。文章将分为三大部分：基础理论、实战案例和深度学习结合。首先，我们将介绍Kafka的架构和核心概念；然后，通过具体的代码实例，解析Kafka Topic的创建、消息发送

overfit同步小助手 2024-10-24 13:03:38 0 收藏

Spark等大数据处理框架的Java API

Apache Spark 提供了丰富的 Java API，用于处理大规模数据集。Spark Core：提供了基础的分布式计算能力，包括任务调度、内存管理、容错恢复等。Spark SQL：用于处理结构化数据，支持 SQL 查询和 DataFrame API。：用于处理实时流数据。MLlib：用于机器学

overfit同步小助手 2024-10-24 12:03:39 0 收藏

大数据-179 Elasticsearch - 原理剖析倒排索引与读写流程

倒排索引是 Elasticsearch 实现高效全文搜索的基础。它通过构建基于词项的文档ID映射，使得搜索引擎可以快速找到包含某个词项的文档，并进行相关性计算和排序。倒排索引的原理结合了分词、标准化处理和高效的数据结构设计，确保了 Elasticsearch 在处理大规模数据时，仍然能够提供快速、准

overfit同步小助手 2024-10-24 12:03:28 0 收藏

CCF-BDCI大数据与计算智能大赛TOP4-京东生鲜

在中国拥有万亿市场规模的生鲜商品，已成为全场景多业态零售商的引流明星。生鲜商品货架期短、易损耗、价格变化频繁，同时多业态销售又增加了新的不确定性。全场景多业态生鲜超市订单有线上和线下两个来源，门店备货也采用前场(超市门店)+后场(门店仓库)的布局。门店日常经营中，每天经常面临两个重要决策：1)总备货

overfit同步小助手 2024-10-24 11:03:50 0 收藏

基于大数据+大屏可视化+协同过滤算法的经济型酒店推荐系统

【2025最新】基于Python大数据+大屏可视化+协同过滤算法+Django+Vue+MySQL的经济型酒店推荐系统。

overfit同步小助手 2024-10-24 10:04:24 0 收藏

Kafka-代码示例

让我们根据kafka源码中的例子来感受下数据的流转过程

overfit同步小助手 2024-10-24 10:04:02 0 收藏

基于大数据的高校新生数据可视化分析系统

Django-Admin来自django.contrib也就是Django的标准库，默认被配置好，只需要激活启用即可，它的优势在于可以快速对数据库的各个表进行增删改查，一行代码即可管理一张数据库表，相比于手动后台1个模型一般需要4个urls，4个视图函数和4个模板，可以说Django完成了一个程序编

overfit同步小助手 2024-10-24 08:04:09 0 收藏

大数据新视界 --大数据大厂之基于 MapReduce 的大数据并行计算实践

本文深入探讨 MapReduce 的核心概念与原理，对比其他并行计算框架，阐述多种应用案例，分析性能优化与挑战，介绍实际部署与运维，探讨与新兴技术的融合，旨在为大数据处理提供全面且深入的实践参考。

overfit同步小助手 2024-10-24 06:03:44 0 收藏

Iceberg 基本操作和快速入门二-Spark DDL操作

启动spark会话proddbsampleiddatastringUSINGiceberg;id bigint,proddbsamplepayload;proddbsampleid;');----语法---示例DROP TABLEproddbsample;DROP TABLEproddb;

overfit同步小助手 2024-10-24 03:03:28 0 收藏

Hive企业级调优[5]—— HQL语法优化之数据倾斜

数据倾斜问题通常指的是参与计算的数据分布不均，即某个key或某些key的数据量远超其他key，导致在shuffle阶段，大量相同key的数据被发送到同一个Reduce节点，从而使该Reduce节点所需的时间远超其他Reduce节点，成为整个任务的瓶颈。Hive中的数据倾斜常见于分组聚合和join操作

overfit同步小助手 2024-10-24 03:03:19 0 收藏

spark 面试题

的堆内空间进行更为详细的分配，以便充分利用内存。同时也引入了堆外内存，使之可以直接在工作节点的系统内存中开辟空间，进一步优化了内存的使用。堆内内存大小记录是不准确的，需要留出保险区域（在 Spark 2.2.1 中是写死的，其值等于 300MB，这个值是不能修改的）都执行迅速，只有有限的几个task

overfit同步小助手 2024-10-24 02:03:43 0 收藏

k8s集群部署：建立第一个微服务-注册中心Eureka

2、为了后续更方便镜像包的构建，以及应用部署，在pom文件中添加jenkins、harbor等相关配置。同时为了更方便的部署eureka高可用，在pom文件中引入nacos做为配置中心。1、建立eureka server微服务，打开启动类，添加@EnableEurekaServer。3、建立Doke

overfit同步小助手 2024-10-24 02:03:17 0 收藏

【RabbitMQ——消息应答机制——分布式事务解决方式】

NONE值是禁用发布确认模式，是默认值创建一个自己的消息确认类。

overfit同步小助手 2024-10-24 01:03:52 0 收藏

大数据新视界 --大数据大厂之区块链技术：为大数据安全保驾护航

本文深入剖析了区块链技术在大数据安全中的应用，包括其概述、工作原理、优势、挑战以及在金融领域的丰富应用案例，并加入了实际数据进行说明。通过详细阐述和代码展示，为读者呈现区块链技术为大数据安全保驾护航的强大力量。

overfit同步小助手 2024-10-23 22:03:10 0 收藏