大数据 - overfit.cn

大数据分析的Python实战指南：数据处理、可视化与机器学习【上进小菜猪大数据】

结论：本文介绍了使用Python进行大数据分析的实战技术，包括数据清洗、数据探索、数据可视化和机器学习模型训练等方面。通过掌握这些技术，您可以更好地处理和分析大数据，并从中获取有价值的信息。使用Python的丰富生态系统和易用性，您可以更高效地进行大数据分析和实践。通过有效地处理和分析大量的数据，

overfit同步小助手 2023-07-10 01:04:16 0 收藏

kafka消费组查看和删除

生产环境监控发现kafka存在大量消费组查看消费组信息：./kafka-consumer-groups.sh --bootstrap-server ip:port --list查看特定消费组信息：./kafka-consumer-groups.sh --bootstrap-server ip:po

overfit同步小助手 2023-07-10 00:04:19 0 收藏

hive array[bigint]转string

overfit同步小助手 2023-07-10 00:03:54 0 收藏

云原生系列之管理docker容器中的数据管理实战

docker容器中数据管理实战

overfit同步小助手 2023-07-09 23:04:03 0 收藏

rabbitmq管理页面发送消息

rabbitmq

overfit同步小助手 2023-07-09 21:04:34 0 收藏

【Jeepay】02-Kafka实现延迟消息与广播模式详细设计

在专题的上一章中，重点讲解了项目的改造背景、难点分析。之所以会如此的追本溯源的去记录，第一是因为：一个可以落地的解决方案的敲定，是综合项目各方面的原因得到的。没有完美的架构，只有刚好的架构；没有满足一切的架构，只有满足目标的架构。第二是因为想要通过这样的记录，让后面的同学能快速的理解：实践中并不需要

overfit同步小助手 2023-07-09 20:03:56 0 收藏

zookeeper中节点信息的查看方式

overfit同步小助手 2023-07-09 15:04:37 0 收藏

深入理解Dockerfile：构建镜像的详细解释与常用命令

云原生 docker

overfit同步小助手 2023-07-09 15:03:59 0 收藏

绿色经济：WIPO 绿色专利分类数据

overfit同步小助手 2023-07-09 13:04:10 0 收藏

hive向上取整、向下取整、保留小数位的函数

hive向上取整向下取整和保留小数位数的函数

overfit同步小助手 2023-07-09 13:03:39 0 收藏

hiveSql冷门但好用函数 --持续更新

overfit同步小助手 2023-07-09 12:04:27 0 收藏

kafka如何在运行中增加分区并重新分配副本

overfit同步小助手 2023-07-09 09:04:04 0 收藏

Hive limit 和 offset 的用法

如果数据量大需要限制数量，只看部分数据，那么 LIMIT 和 OFFSET 子句就非常用有。LIMIT 可以减少要返回的行数，而 OFFSET 将指定从何处开始计算行数。本文例子中使用的数据是筛选指定字段中的数据内容。

overfit同步小助手 2023-07-09 09:03:56 0 收藏

Rabbit health check failed

说明：项目并未配置rabbitmq，但是每次项目启动的时候总是会报错，rabbitmq连接异常，健康检查失败，但是不影响项目运行。具体报错信息如下：具体查看报错内容后发现：原来是项目配置了spring健康检查：解决：在配置文件中添加rabbitmq的健康检查忽略再次启动项目，报错没有了~~~

overfit同步小助手 2023-07-09 08:04:21 0 收藏

Spark心得体会

spark心得体会！！

overfit同步小助手 2023-07-09 08:04:07 0 收藏

Python旅游景点数据大屏爬虫+实时监控系统旅游数据可视化大数据毕业设计

overfit同步小助手 2023-07-09 07:04:06 0 收藏

启动yarn时，resourcemanager启动失败

使用启动yarn后，再使用jps查看进程，发现只有Notemanager启动了，而resourcemanager没有启动。

overfit同步小助手 2023-07-09 07:03:51 0 收藏

windows上Hadoop的安装和使用

Hadoop的安装和使用（windows）

overfit同步小助手 2023-07-09 07:03:43 0 收藏

安装rabbitmq图文详解步骤

overfit同步小助手 2023-07-09 05:04:14 0 收藏

Spark Streaming + Kafka构建实时数据流

因为在这个例子中，数据是实时流式处理的，而不是一次处理一个批次的静态数据。流式数据的实时特性意味着数据不断更新，因此很难保持缓存的数据与最新的数据的一致性。所以在流处理中，更有效的性能优化方法是使用更高效的算法，并通过对流数据的精细控制来调整计算中的批大小和触发机制，而不是简单地使用缓存方法。这个是

overfit同步小助手 2023-07-09 05:04:00 0 收藏