大数据 - overfit.cn

Windows系统下的Spark环境配置

在 Windows 系统上配置 Spark 环境涉及到几个步骤，包括安装 Java、下载和解压 Spark、配置环境变量以及验证安装。

overfit同步小助手 2024-09-09 04:03:44 0 收藏

Hive的安装

将apache-hive-3.1.2-bin.tar.gz 上传到hadoop102的/opt/software 目录下。解压 apache-hive-3.1.2-bin.tar.gz 到/opt/module/目录下面。修改 apache-hive-3.1.2-bin.tar.gz 的名称为 hi

overfit同步小助手 2024-09-09 03:03:38 0 收藏

掌握Flink键控状态（Keyed State）：深入指南与实践

在Flink中，键控状态是与特定键相关联的状态，每个键可以有自己的状态副本。键控状态对于需要对每个分组键分别进行计算的场景非常有用，例如，计算每个用户的点击总数。

overfit同步小助手 2024-09-09 02:03:54 0 收藏

毕设成品基于大数据情感分析的网络舆情分析系统(源码+论文)

Python下有多款不同的 Web 框架，Django是最有代表性的一种。许多成功的网站和APP都基于Django。Django是一个开源的Web应用框架，由Python写成。Django采用了MVC的软件设计模式，即模型M，视图V和控制器C。

overfit同步小助手 2024-09-09 02:03:50 0 收藏

Kafka

消息中间件是基于队列与消息传递技术，在网络环境中为应用系统提供同步或异步、可靠的消息传输的支撑性软件系统。消息中间件利用高效可靠的消息传递机制进行平台无关的数据交流，并基于数据通信来进行分布式系统的集成。通过提供消息传递和消息排队模型，它可以在分布式环境下扩展进程间的通信。

overfit同步小助手 2024-09-09 02:03:47 0 收藏

深度掌握 RabbitMQ 消息确认（ACK）机制，确保消息万无一失

自动 ACK：当消费者从队列中获取消息后，RabbitMQ 会自动将该消息标记为已确认，无需消费者手动进行确认操作。手动 ACK：消费者需要在处理完消息后，手动向 RabbitMQ 发送确认消息，告知 RabbitMQ 该消息已经被成功处理。关键知识点回顾：本文详细介绍了 RabbitMQ 的消息确

overfit同步小助手 2024-09-09 02:03:36 0 收藏

使用 vLLM 为多个 LoRA 适配器提供服务

欢迎来到。使用 LoRA 适配器，我们可以针对某项任务或领域专门设计大型语言模型 (LLM)。适配器必须加载到 LLM 之上才能用于推理。对于某些应用，为用户提供多个适配器可能会很有用。例如，一个适配器可以执行函数调用，另一个适配器可以执行非常不同的任务，例如分类、翻译或其他语言生成任务。然而，要使

overfit同步小助手 2024-09-09 01:03:53 0 收藏

大数据AI人工智能与 GPU、TPU 超级算力融合引领人类智能时代技术革命原理与应用实践

在21世纪的第三个十年,我们正站在人类智能时代的门槛上。这个新时代的到来,得益于大数据、人工智能(AI)以及GPU(图形处理器)和TPU(张量处理器)等超级算力的融合与发展。这些技术的结合不仅推动了科技的进步,更是引领着一场深刻的技术革命,正在重塑我们的社会、经济和生活方式。大数据为AI提供了海量的

overfit同步小助手 2024-09-09 01:03:50 0 收藏

深度解析提升 Kafka 效率的多种关键手段

过大的 fetch.min.bytes 可能会导致消息延迟增加，过小的 fetch.min.bytes 则无法充分发挥批获取的优势。需要根据实际情况调整 Consumer 的配置参数，例如 fetch.min.bytes、fetch.max.wait.ms、auto.commit.interval.

overfit同步小助手 2024-09-09 00:03:47 0 收藏

RabbitMQ-发布/订阅模式

关于扇形交换机，核心的一点需要我们记住，发送到扇形交换机的消息，他会将消息广播给所有绑定到该交换机的队列上，无脑广播，所有队列会同时接受到交换机上全部的消息。

overfit同步小助手 2024-09-09 00:03:41 0 收藏

探索大数据处理的基石：Apache Hadoop Thirdparty项目解析与应用推广

探索大数据处理的基石：Apache Hadoop Thirdparty项目解析与应用推广 hadoop-thirdpartyHadoop Thirdparty 是一个用于管理 Hadoop 第三方依赖的项目。它提供了一个用于存储和管理 Hadoop 项目中使用的第三方库和工具的仓库，以便于 Hado

overfit同步小助手 2024-09-09 00:03:08 0 收藏

RabbitMQ的高可用

模式，消费者会在完成业务处理后自动进行应答，而如果消费者的业务逻辑抛出异常，RabbitMQ会将消息进行重试，这样是不会丢失消息的，但是有可能会造成消息一直重复消费。首先他的普通集群模式，消息是分散存储的，不会主动进行消息同步了，是有可能丢失消息的。而他的弊端也是明显的，集群内部的网络带宽会被这种同

overfit同步小助手 2024-09-08 23:03:48 0 收藏

datax做增量导入数据到hive:mysql＞hive

datax做增量导入mysql数据到hive

overfit同步小助手 2024-09-08 22:03:51 0 收藏

fs2-rabbit: 基于Fs2的RabbitMQ流式客户端

fs2-rabbit: 基于Fs2的RabbitMQ流式客户端 fs2-rabbit:rabbit: RabbitMQ stream-based client built on top of Fs2项目地址:https://gitcode.com/gh_mirrors/fs/fs2-rabbit 项

overfit同步小助手 2024-09-08 22:03:42 0 收藏

大数据技术之Zookeeper安装（2）

1）安装JDKLinux环境安装 JDK2）拷贝安装包到Linux系统下3）解压到指定目录4）修改名称1）将这个路径下的修改为zoo.cfg；2）打开zoo.cfg文件，修改dataDir路径：3）在这个目录上创建zkData文件夹1）启动Zookeeper2）查看进程是否启动3）查看状态4）启动客

overfit同步小助手 2024-09-08 19:03:55 0 收藏

毕业设计基于大数据的游数据分析可视化系统(源码分享)

今天学长向大家分享一个毕业设计项目毕业设计基于大数据的游数据分析可视化系统(源码分享)演示效果毕业设计大同旅游数据分析可视化系统🧿 项目分享:见文末!数据可视化是数据处理中的重要部分Django是一个基于Web的应用框架，由python编写。Web开发的基础是B/S架构，它通过前后端配合，将后

overfit同步小助手 2024-09-08 19:03:29 0 收藏

二百五十九、Java——采集Kafka数据，解析成一条条数据，写入另一Kafka中（一般JSON）

Java——采集Kafka数据，解析成一条条数据，写入另一Kafka中（一般JSON）

overfit同步小助手 2024-09-08 19:03:19 0 收藏

【JVM内存】系统性排查JVM内存问题的思路

Non-Heap Space 翻译为非堆内存，也被称为Off-Heap(堆外内存)，大家习惯于叫这部分内存为堆外内存。查看了很多国内外文章，对于这块内存，没有很统一的定义。广义上的Non-Heap除开Heap以外的所有内存，包括MetaSpace、NativeMemory(JNI Memory、Di

overfit同步小助手 2024-09-08 18:04:03 0 收藏

HiveMQ MQTT 客户端：高效、灵活的MQTT通信解决方案

HiveMQ MQTT 客户端：高效、灵活的MQTT通信解决方案 hivemq-mqtt-clientHiveMQ MQTT Client is an MQTT 5.0 and MQTT 3.1.1 compatible and feature-rich high-performance Java

overfit同步小助手 2024-09-08 18:03:59 0 收藏

RabbitMq原理与详解

RabbitMQ是流行的开源消息队列系统，是AMQP（Advanced Message Queuing Protocol高级消息队列协议）的标准实现，用erlang语言开发。RabbitMQ据说具有良好的性能和时效性，同时还能够非常好的支持集群和负载部署，非常适合在较大规模的分布式系统中使用。

overfit同步小助手 2024-09-08 18:03:56 0 收藏