大数据 - overfit.cn

Kafka的安装及接入SpringBoot

Kafka 是一种高性能、分布式的消息队列系统，最初由 LinkedIn 公司开发，并于2011年成为 Apache 顶级项目。它设计用于处理大规模的实时数据流，具有高吞吐量、低延迟、持久性等特点，被广泛应用于构建实时数据管道、日志收集、事件驱动架构等场景。

overfit同步小助手 2024-05-27 05:03:55 0 收藏

分布式SQL计算Hive入门（黑马程序员）Day2

Hive是一个基于Hadoop的数据仓库系统，它提供了类似于SQL的查询语言HiveQL，可以将结构化数据存储在Hadoop分布式文件系统中，并通过MapReduce进行过处理。作用：删除参数指定的文件和目录，参数可以有多个，删除目录需要加-r参数如果指定-skipTrash选项，那么在回收站可

overfit同步小助手 2024-05-27 05:03:45 0 收藏

万字长文，大数据PowerBI面试题及参考答案

PowerBI支持自定义视觉效果，这些视觉效果是由社区开发的，可以提供独特的数据可视化方式。用户可以通过PowerBI市场获取并使用这些自定义视觉效果。// 使用自定义视觉效果的步骤1. 打开PowerBI报告视图。2. 点击“插入”选项卡，然后选择“自定义视觉效果”。3. 从市场中选择一个视觉效果

overfit同步小助手 2024-05-27 05:03:40 0 收藏

kafka系列一：初识kafka

kafka是由scala语言编写的一个分布式且具备高可用、高性能、可持久化、可水平扩展、支持流数据处理等众多特性的消息系统，常活跃于大数据生态中，而且大名鼎鼎的rocketmq就是参考了kafka的设计原理。目前越来越多的开源分布式中间件都支持与kafka集成（elk、spark、storm、can

overfit同步小助手 2024-05-27 04:03:33 0 收藏

How to Install PySpark on Mac(Mac上安装PySpark)

overfit同步小助手 2024-05-27 03:03:59 0 收藏

携程API接口与旅游大数据的结合

通过合理利用携程API接口获取的旅游数据，并结合旅游大数据的分析方法，企业可以深入了解市场动态和消费者需求，制定更加精准的市场策略和产品方案，提升市场竞争力和用户满意度。未来，随着技术的不断进步和应用场景的不断拓展，携程API接口与旅游大数据的结合将在旅游行业中发挥更加重要的作用。携程API接口提供

overfit同步小助手 2024-05-27 03:03:43 0 收藏

RabbitMQ 是如何做延迟消息的？——Java全栈知识（15）

当一个队列中的消息满足下列情况之一时，可以成为死信（dead letter）：架构：由于第一个队列没有消费者，所以可以在第一个队列中设置 TTL，当消息过期的时候，这个消息就变成了死信，被丢掉私信交换机中，以此实现延迟任务功能。前面两种作用场景可以看做是把死信交换机当做一种消息处理的最终兜底方案，与

overfit同步小助手 2024-05-27 03:03:40 0 收藏

hadoop离线与实时的电影推荐系统-计算机毕业设计源码10338

管理员：首页、网站管理（轮播图、公告消息）人员管理（管理员、普通用户）内容管理（电影资讯、资讯分类）模块管理（电影信息、电影类型）个人信息；用户：首页、公告消息、电影资讯、电影信息管理等

overfit同步小助手 2024-05-27 03:03:30 0 收藏

CentOS7安装flink1.17完全分布式

CentOS7安装flink1.17完全分布式。

overfit同步小助手 2024-05-27 03:03:20 0 收藏

RabbitMQ、RocketMQ和Kafka全面对决，谁是最佳选择？

适用于易用性和灵活性要求较高的场景异步任务处理：RabbitMQ提供可靠的消息传递机制，适用于处理异步任务，例如将耗时的任务放入消息队列中，然后由消费者异步处理，提高系统的响应速度和可伸缩性。解耦系统组件：通过使用RabbitMQ作为消息中间件，不同的系统组件可以通过消息进行解耦，实现松耦合的架构，

overfit同步小助手 2024-05-27 02:04:01 0 收藏

大数据｜实验三：PageRank算法实现

PageRank是一种在搜索引擎中根据网页之间相互的链接关系计算网页排名的技术。

overfit同步小助手 2024-05-27 02:03:49 0 收藏

RabbitMQ 安装登陆提示：User can only log in via localhost

RabbitMQ默认提供了一个guest/guest用户，但是从3.3.0 版本以后该账号只能localhost登陆（User can only log in via localhost）给用户user赋予权限，授予user用户可访问虚拟主机 /，并在所有的资源上具备可配置、可写及可读的权限。创建完

overfit同步小助手 2024-05-27 01:03:54 0 收藏

Hive中UNION ALL和UNION的区别

Hive官方提供了一种联合查询的语法，原名为Union Syntax，用于联合两个表的记录进行查询，此处的联合和join是不同的，join是将两个表的字段拼接到一起，而union是将两个表的记录拼接在一起。换言之， join是用于左右拼接，而union是用于上下拼接。联合查询方式UNIONUNION

overfit同步小助手 2024-05-27 00:03:56 0 收藏

Flink CDC 1.18.1 Oracle 数据同步到postgresql

8、修改Flink的配置文件，主要是各种服务的绑定地址，默认为localhost，统统改为0.0.0.0，如：rest.address: 0.0.0.0 #localhost。将flink-sql-connector-oracle-cdc-3.0.1.jar复制到flink-1.18.1/lib目录

overfit同步小助手 2024-05-26 23:03:59 0 收藏

如何8步完成hadoop单机安装

Hadoop是一个开源框架，用于存储和处理大规模数据集。

overfit同步小助手 2024-05-26 23:03:44 0 收藏

解决pyspark运行报错：env: /usr/local/bin/python3: 没有那个文件或目录

路径是升级python版本后的python执行文件的目录。修改spark-env.sh文件。pyspark运行成功。

overfit同步小助手 2024-05-26 23:03:38 0 收藏

大数据技术之Hadoop-3.3.4高可用安装部署操作文档

overfit同步小助手 2024-05-26 22:05:00 0 收藏

ERROR: KeeperErrorCode = NoNode for /hbase/master

今天使用hbase查看数据库的时候，出现了以下报错：这个错误信息表示在 ZooKeeper 中找不到名为 "/hbase/master" 的节点。这通常意味着 HBase 的元数据没有正确地存储在 ZooKeeper 中，或者 ZooKeeper 的配置有误。

overfit同步小助手 2024-05-26 22:04:55 0 收藏

RabbitMQ最全使用教程-小白也能看懂

我还通过一些渠道整理了一些大厂真实面试主要有：蚂蚁金服、拼多多、阿里云、百度、唯品会、携程、丰巢科技、乐信、软通动力、OPPO、银盛支付、中国平安等初，中级，高级Java面试题集合，附带超详细答案，希望能帮助到大家。还有专门针对JVM、SPringBoot、SpringCloud、数据库、Linux

overfit同步小助手 2024-05-26 22:04:47 0 收藏

【最新版RabbitMQ3.13】Linux安装基于源码构建的RabbitMQ教程

【最新版RabbitMQ3.13】Linux安装基于源码构建的RabbitMQ教程erlang和rabbitmq的安装

overfit同步小助手 2024-05-26 22:04:18 0 收藏