大数据 - overfit.cn

大数据新视界 --大数据大厂之数据脱敏技术在大数据中的应用与挑战

本文深入阐述大数据发展现状，全面剖析数据脱敏技术在大数据中的应用与挑战，涵盖企业内部数据使用、数据共享合作及云计算环境等场景，探讨面临的挑战及解决方案，并展望未来发展趋势。通过丰富案例和代码展示，为读者提供深入了解的契机。

overfit同步小助手 2024-10-22 08:03:14 0 收藏

Dubbo 内置的 Zookeeper 端口配置问题详解

在 Dubbo 内置的 Zookeeper 注册中心中，正确配置 Zookeeper 的端口非常关键。无论是单实例 Zookeeper 还是集群模式，端口的正确设置将直接影响到 Dubbo 服务的注册和发现功能。通过检查端口冲突、远程连接、防火墙等问题，可以有效避免服务启动失败的情况，提高系统的稳定

overfit同步小助手 2024-10-22 07:03:27 0 收藏

YARN：Hadoop 资源管理与调度框架

YARN 是 Hadoop 中的资源调度平台，负责为计算程序提供集群资源，可以看作是 Hadoop 分布式计算环境的操作系统。它使得多个应用程序能够同时运行，并且能够通过调度策略高效地分配资源，提升集群的利用率和吞吐量。YARN 的核心功能是将资源管理与任务调度分离，它通过全局的资源管理器，本地的任

overfit同步小助手 2024-10-22 06:03:41 0 收藏

数据字典是什么？和数据库、数据仓库有什么关系？

数据字典是一种对数据的定义和描述的集合，它包含了数据的名称、类型、长度、取值范围、业务含义、数据来源等详细信息。数据字典的主要作用如下：1. 对于数据开发者来说，数据字典包含了关于数据结构和内容的清晰指南，能够让开发者理解数据的含义和用途，从而更准确地进行数据开发和维护工作。2. 对于业务人员来说，

overfit同步小助手 2024-10-22 06:03:29 0 收藏

一文通透Flink端到端精确一次语义:原理、实现与最佳实践

Flink端到端的精确一次语义是流处理中的关键概念，涉及状态一致性和结果正确性。这一特性涵盖了整个数据处理流程，包括数据源、流处理器和外部存储系统三个主要组件。Flink内部通过检查点机制实现精确一次语义，但要达到端到端的一致性，还需要考虑输入和输出端的保证：输出端：需要实现以下两种写入方式之一：a

overfit同步小助手 2024-10-22 05:03:50 0 收藏

毕设开源基于大数据的b站数据分析

本文主要运用Python的第三方库SnowNLP对弹幕内容进行情感分析，使用方法很简单，计算出的情感score表示语义积极的概率，越接近0情感表现越消极，越接近1情感表现越积极。从数据可视化中可以看到，播放量排名前三的分别是生活类、动画类、鬼畜类，让人诧异的是以动漫起家的B站，播放量最多的视频分类竟

overfit同步小助手 2024-10-22 05:03:47 0 收藏

黑马面试消息中间件MQ篇笔记整理, 结尾附上RabbitMQ和Kafka高频面试题

消息中间件高频面试题

overfit同步小助手 2024-10-22 05:03:33 0 收藏

[实时计算flink]Queries语句

本文为您介绍Flink全托管支持的Queries语句详情。Flink全托管兼容Apache Flink的Queries语句。以下BNF-grammar描述了支持的流批SQL特性的超集。对于标识符（表名，列名，函数名），Flink 采用了和Java相似的语法策略：不管标识符是否被反引号标识，该标识符是

overfit同步小助手 2024-10-22 04:03:49 0 收藏

flink：java集成flink实现流数据处理（一）

2、引入依赖对应flink相关的依赖需要单独说明下，其jar版本需要根据flink版本来定，flink 1.11之前版本使用的是scala2.11, 之后加入了对scala2.12的支持，不同的版本引入的jar名称不同，比如包有3个，对应不同的scala版本，则为对多个版本的兼容版一般我们根据sca

overfit同步小助手 2024-10-22 04:03:38 0 收藏

Sqoop在mysql和hadoop互导的时候发生报错分析：

其中hive中的字符集为utf-8，但是mysql中默认的字符集为utf8mb4 ，这个字符集是utf-8的扩展类，但是和utf-8不互相兼容，这个字符集能够接受的字符数为4个utf-8的字符数为3个，需要更改mysql中的字符集为utf8mb3，MySQL中的这个字符集是和utf-8相对应。这个是

overfit同步小助手 2024-10-22 04:03:33 0 收藏

RabbitMQ Sharding 插件使用教程

RabbitMQ Sharding 插件使用教程 rabbitmq-sharding Sharded logical queues for RabbitMQ: a queue type which provides improved

overfit同步小助手 2024-10-22 03:05:08 0 收藏

hadoop拒接连接，无法从浏览器界面50070访问

IP地址成功，名称却失败，可能是主机的文件未更新（及虚拟机名称映射到其IP地址上），可以手动添加，打开C:\Windows\System32\drivers\etc\hosts，由于 hosts 文件属性系统文件，因此需要管理员权限才能对其进行修改。虚拟机中Hadoop集群环境都搭建好了，启动起来，

overfit同步小助手 2024-10-22 01:03:32 0 收藏

基于 Hadoop 平台的岗位推荐系统的设计与实现

❤️博主介绍❤️：在数字的海洋里，我是“星码绘梦”，一个用代码编织梦想的旅者。在无尽的虚拟世界中，我以键盘为舟，以逻辑为帆，航行在信息的浪潮之上。每行代码都是我探索未知的足迹，每个程序都是我心中梦想的映射。我是创造者，也是诗人，用0和1的音符，谱写着未来的乐章。在星码绘梦的世界里，我让想象成为现实，

overfit同步小助手 2024-10-22 01:03:26 0 收藏

大数据-177 Elasticsearch Query DSL - 聚合分析 &指标聚合 & 桶聚合

Elasticsearch 的聚合分析是一种强大的功能，允许用户在查询数据的同时对其进行统计分析、分组计算和排序，类似于 SQL 中的 GROUP BY 和 COUNT() 等操作。聚合分析包括两个主要类别：指标聚合和桶聚合。在聚合的基础上，你还可以进行嵌套聚合，将多个聚合组合在一起，从而构建复杂的

overfit同步小助手 2024-10-22 00:03:24 0 收藏

SpringBoot 整合 RabbitMQ 的使用

多个工作者（Worker）同时监听同一个队列，当有新的任务消息被发送到队列中时，空闲的工作者会获取并处理这些任务，确保任务能够并行处理而不会重复执行。消息发送者（Producer）发送消息到队列，然后消息接收者（Consumer）从队列中获取消息进行处理。交换机负责将消息路由到一个或多个绑定的队列中

overfit同步小助手 2024-10-21 22:04:06 0 收藏

zookeeper API使用——znode的CRUD

以下的代码只能作为基础的语法使用，为了简洁，我尽量使得每个功能区分开，代码内可能存在一些冗余，自行删除即可。

overfit同步小助手 2024-10-21 21:03:54 0 收藏

基于大数据的豆瓣电子图书推荐系统的设计与实现(源码+LW+报告+运行调试)

通过约定优于配置，减少了复杂的 XML 配置，提供了自动配置功能，让开发者可以快速上手。内置的启动器（Starter）和自动配置功能使得新项目的搭建变得非常简单，开发者可以专注于业务逻辑。Spring Boot 支持内嵌的 Tomcat、Jetty 或 Undertow，无需外部应用服务器，方便部署

overfit同步小助手 2024-10-21 20:03:39 0 收藏

第八章 RabbitMQ之消息转换器

在RabbitMQ中，消息转换器（Message Converter）用于在发送消息时将Java对象转换为RabbitMQ可以理解的字节流，以及在消费者接收消息时将字节流转换回Java对象。在实际的RabbitMQ应用中，你会配置转换器作为Spring AMQP的一部分，并在发送和接收消息时由Spr

overfit同步小助手 2024-10-21 19:03:44 0 收藏

【分布式微服务云原生】《ZooKeeper 深度探秘：分布式协调的强大利器》

ZooKeeper 是什么ZooKeeper 是一个开源的分布式协调服务，由 Apache 软件基金会提供。它为分布式应用提供一致性服务，广泛的功能包括配置管理、分布式锁、集群管理等。设计目标ZooKeeper 的设计目标是提供高可用的、高性能的、可靠的存储服务，以支持分布式应用的一致性协调。

overfit同步小助手 2024-10-21 19:03:26 0 收藏

springboot基于 Hadoop 平台的招聘岗位推荐系统的设计与实现-python爬虫可视化大屏数据分析系统

SpringBoot和Vue作为当前主流的技术框架，具有开发效率高、安全性强、用户体验良好等优点。使用开源的SpringBoot框架进行快速构建项目和自动配置，快速开发；使用前端主流框架Vue.js框架与ElementUI组件化开发的设计方式，降低前端开发难度、提高开发速度，为用户提供更加友好的界面

overfit同步小助手 2024-10-21 18:04:30 0 收藏