大数据 - overfit.cn

hive中substring_index()的使用

hive sql substring_index

overfit同步小助手 2023-07-29 10:04:00 0 收藏

Kafka 使用java实现，快速入门

【代码】Kafka 集成 SpringBoot，快速入门。

overfit同步小助手 2023-07-29 09:04:14 0 收藏

为什么要搭建数据仓库

数据是企业中最重要的资源之一，因此，随着企业数据量的不断增大和复杂度的提高，建立一个可靠和健全的数据仓库变得越来越重要。在数聚股份看来，一个数据仓库可以作为一个企业数据存储和管理系统，能够更有效地存储、管理和分析数据。那么，为什么要搭建数据仓库呢？

overfit同步小助手 2023-07-29 09:04:09 0 收藏

配置Kafka发送大消息

在本文中，我们介绍了配置调优Kafka选项以发送大于1MB的大消息。包括生产者端、主题、代理服务和消费者端的配置选项。其中一些选项是强制配置，一些是可选配置，虽然消费者配置是可选的，但可以避免负面的性能影响。最后，我们还介绍了发送大消息的其他可能选项。内容参考：[Send Large Message

overfit同步小助手 2023-07-29 08:03:53 0 收藏

2022 年首届“钉钉杯”大学生大数据挑战赛B题：航班数据分析与预测——国奖论文代码分享

随着民航事业的迅速发展飞机出行已成为未来发展的一种必然趋势，然而近年来，航班延误现象频频发生，成为困扰机场和航空公司的难题。对航班延误做出合理评价是分析航班延误总体水平、降低延误成本，以及制定相关处置预案的重要基础，有着重要的现实运用价值。针对机场聚类分析问题的第一部分，首先按照题目要求的五种

overfit同步小助手 2023-07-29 07:04:18 0 收藏

Hbase Shell操作

overfit同步小助手 2023-07-29 07:04:14 0 收藏

解决Hive视图View数据乱码的问题

overfit同步小助手 2023-07-29 07:04:00 0 收藏

Kafka运维监控：Kafka-Eagle安装

kafka自身并没有集成监控管理系统，因此对kafka的监控管理比较不便，好在有大量的第三方监控管理系统来使用，常见的有：Kafka Manager（雅虎开源的Kafka集群管理器）还有JMX接口自开发监控管理系统。

overfit同步小助手 2023-07-29 06:04:23 0 收藏

flink客户端提交任务报错

【代码】flink客户端提交任务报错。

overfit同步小助手 2023-07-29 05:04:19 0 收藏

Hive（25）：Select高级查询之Subqueries子查询

1 from子句中子查询在Hive0.12版本，仅在FROM子句中支持子查询。而且必须要给子查询一个名称，因为FROM子句中的每个表都必须有一个名称。子查询返回结果中的列必须具有唯一的名称。子查询返回结果中的列在外部查询中可用，就像真实表的列一样。子查询也可以是带有UNION的查询表达式。Hive支

overfit同步小助手 2023-07-29 05:04:13 0 收藏

centos7安装rabbitmq

erl。

overfit同步小助手 2023-07-29 05:04:08 0 收藏

三、Kafka的消费全流程

我们接着继续去理解最后这条消息是如何被消费者消费掉的。其中最核心的有以下内容。1、多线程安全问题2、群组协调3、分区再均衡。

overfit同步小助手 2023-07-29 04:04:06 0 收藏

工业互联网和物联网有什么关系？

工业互联网是基于物联网发展起来的，或者说是以物联网为基础，是IT/CT/OT融合的一体化工业系统，所以又有别于物联网，下面详细来讲解下。工业互联网就是要实现物理形式的企业在数字空间的投射，并基于此来实现的以人机物(Human，Machines，Things)泛在互联为基础上，深度感知为支撑，智能决策

overfit同步小助手 2023-07-29 03:04:14 0 收藏

Cannot safely cast ‘createtime‘: string to timestamp；

ANSI 策略（），不允许 Spark 进行某些不合理的类型转换，如：string 转换成 timestamp。LEGACY 策略，允许 Spark 进行类型强制转换，只要它是有效的 Cast 操作。SQL 增加了一个安全策略，不对非同类型的数据进行强制转换，然后就会出现这个错误。STRICT 策略

overfit同步小助手 2023-07-29 02:03:51 0 收藏

聊聊hdfs中的rpc问题

hdfs中的rpc问题

overfit同步小助手 2023-07-28 20:04:32 0 收藏

记一次rabbitmq消息发送成功，消费丢失问题

Trace 是Rabbitmq用于记录每一次发送的消息，方便使用Rabbitmq的开发者调试、排错。可通过插件形式提供可视化界面。

overfit同步小助手 2023-07-28 17:04:03 0 收藏

springboot集成flink步骤，及demo

overfit同步小助手 2023-07-28 13:04:24 0 收藏

Flink（一）1.12.7或1.13.5详细介绍及本地安装部署、验证

本示例以1.12版本进行介绍，当前版本更新至1.17。Flink 诞生于欧洲的一个大数据研究项目 StratoSphere。该项目是柏林工业大学的一个研究性项目。早期， Flink 是做 Batch 计算的，但是在 2014 年， StratoSphere 里面的核心成员孵化出 Flink，同年将

overfit同步小助手 2023-07-28 10:04:11 0 收藏

什么是HBase

HBase是一个基于Hadoop的分布式列式存储系统，可以存储非结构化和半结构化的大数据，具有高可用性、高扩展性、高性能等特点，常用于大规模实时数据处理。

overfit同步小助手 2023-07-28 10:03:56 0 收藏

RocketMQ源码分析

overfit同步小助手 2023-07-28 09:04:32 0 收藏