大数据 - overfit.cn

FlinkSql开窗实例：消费kafka写入文本

以前写Flink从kafka入hdfs因为业务需求和老版本缘故都是自定义BucketSink入动态目录中，对于简单的需求可以直接用Flink SQL API进行输出。Flink版本1.13.1。

overfit同步小助手 2023-05-07 10:03:40 0 收藏

宝哥面试题分享(14):Eureka面试题：高可用、自我保护模式、eureka和zookeeper的区别

overfit同步小助手 2023-05-07 09:03:39 0 收藏

kafka操作3

粘性分区是kafka从0.11.x版本开始引入这种分配策略，首先会尽量均衡的放置分区到消费者上面，在出现同一消费者组内消费者出现问题的时候，会尽量保持原有分配的分区不变化。虽然自动提交offset十分简单便利，但由于其是基于时间提交的，开发人员难以把握offset提交的时机，因此kafka还提供了手

overfit同步小助手 2023-05-07 08:03:39 0 收藏

kafka：消息发送以及消费的过程

kafka的存储消息，生产者发送消息，消费者消费消息。这些看起来简单，但实际细想，会有很多问题需要解决：消息是单个单个发送还是批量发送？broker的主题里一有消息就立即推送给消费者吗？生产者的消息怎么保证成功发送到kafka，kafka怎么保证消息传给了消费者？

overfit同步小助手 2023-05-07 07:03:37 0 收藏

中心频率法确认VMD的K值的python实现

overfit同步小助手 2023-05-07 07:03:34 0 收藏

Alibaba Canal数据同步 mysql-＞mysql

canal 数据同步 adapter

overfit同步小助手 2023-05-07 07:03:31 0 收藏

HDFS+ MapReduce 数据处理与存储实验

文章目录实验二：HDFS+ MapReduce 数据处理与存储实验1. 实验目的2. 实验环境3. 实验内容3.1 HDFS部分3.1.1 上传文件3.1.2 下载文件3.1.3 显示文件信息3.1.4 显示目录信息3.1.5 删除文件3.1.6 移动文件3.2 MapReduce 部分3.2.

overfit同步小助手 2023-05-07 06:03:56 0 收藏

Windows下安装hadoop2.7.4

该压缩包是已经简化配置后的hadoop2.7.4下载地址文件分享 (weiyun.com)在系统变量中添加在path中添加把/etc/hadoop/ 下目录的相关配置文件都配置一遍，直接赋值下面内容即可①yarn-site.xml②hdfs-site.xml③core-site.xml4、复制一份m

overfit同步小助手 2023-05-07 05:03:50 0 收藏

CV界的chatgpt出现——Segment Anything能分割万物

今天亲手体验了一下meta公司发布的Segment Anything，我们认为是cv界的chatgpt，这个模型太厉害了，厉害到可以对任意一张图进行分割，他们的网站上的例子也是挺复杂的，能够说明其强大的能力—demo链接，人工智能的技术迭代正是太快了。

overfit同步小助手 2023-05-07 04:03:44 0 收藏

Flink 运行错误 java.lang.OutOfMemoryError: Direct buffer memory

如遇到如下错误，表示需要调大配置项taskmanager.memory.framework.off-heap.size 的值，taskmanager.memory.framework.off-heap.size 的默认值为 128MB，错误显示不够用需要调大。

overfit同步小助手 2023-05-07 04:03:35 0 收藏

Kibana使用

Kibana是通向 Elastic 产品集的窗口。它可以在 Elasticsearch 中对数据进行视觉探索和实时分析。Kibana通常用于项目log日志收集分析、数据可视化分析等。

overfit同步小助手 2023-05-07 03:03:35 0 收藏

spring boot+mybatis实现数据库的增删改查

spring boot+mybatis实现数据库的增删改查，程序员筱聪手把手教你

overfit同步小助手 2023-05-07 01:03:36 0 收藏

使用docker安装分布式hadoop（阿里hadoop镜像）

前面使用了docker自带的镜像安装，那么这篇使用阿里镜像搭建hadoop集群，也参考了网上部分播客，但是多多少少有问题，我这篇播客是全部经过实践测试成功跑起来的。

overfit同步小助手 2023-05-07 00:03:48 0 收藏

ETL 与 ELT的关键区别

ETL 和 ELT 之间的主要区别在于转换的时间和位置：它是在数据加载到数据仓库之前还是在存储之后发生。实施管道所需的技术技能，支持每个选项所需的产品数量和复杂性，技能团队雇用的数据团队本身的结构，以及数据堆栈的准备性和灵活性。在我们深入了解这些差异的细节之前，让我们清楚地定义什么是 ETL 和 E

overfit同步小助手 2023-05-06 23:03:44 0 收藏

Kafka---kafka概述和kafka基础架构

kafka概述

overfit同步小助手 2023-05-06 21:03:33 0 收藏

Kafka消费分组和分区分配策略

同一个消费组里的消费者不能消费同一个分区，不同消费组的消费组可以消费同一个分区（即同一个消费组里面的消费者只能在一个分区中）

overfit同步小助手 2023-05-06 20:03:41 0 收藏

热点｜ChatGPT到底是什么，ChatGPT给通信行业带来什么影响

再例如，市场人员进行市场分析和营销策略制定的时候，可以借助AI，分析市场情况（销量、喜好、满意度等），提供决策建议。现在，简单的数据，都是上一级网管分发，自动配置。结合AI，对通信设备进行自动调节功率，甚至进行关断，可以大幅降低设备能耗，减少碳排放，以及电费投入。但是，谁也不知道，也许哪一天，某个厂

overfit同步小助手 2023-05-06 19:03:41 0 收藏

Hive的函数

本文就主要介绍hive函数了。提示：以下是本篇文章正文内容，下面案例可供参考当 Hive 提供的内置函数无法满足业务处理需要时，此时就可以考虑使用用户自定义函数。UDF（user-defined function）作用于单个数据行，产生一个数据行作为输出。UDAF（用户定义聚集函数 User- De

overfit同步小助手 2023-05-06 16:03:51 0 收藏

大数据分析工具Power BI（十八）：图表交互设计

在Power BI中的某个页中绘制的多个图表之间默认有交互关系，例如在"对比分析"页面中我们选择"30分钟包时对应的第二季度"数据时其他三张图表也会对应的展示相应数据信息，这就是图表之间的交互关系，默认在Power BI中该功能是开启的。针对前面绘制的"对比分析"页面上的图表进行数据筛选操作，将"套

overfit同步小助手 2023-05-06 14:03:46 0 收藏

Elasticsearch基础3——密钥库工具、证书生成工具及四种生成模式、https请求步骤流程

1.密钥库工具的使用。2.证书生成工具使用、四种生成模式。3.https请求步骤流程

overfit同步小助手 2023-05-06 14:03:37 0 收藏