hive中substring_index()的使用
hive sql substring_index
Kafka 使用java实现,快速入门
【代码】Kafka 集成 SpringBoot, 快速入门。
为什么要搭建数据仓库
数据是企业中最重要的资源之一,因此,随着企业数据量的不断增大和复杂度的提高,建立一个可靠和健全的数据仓库变得越来越重要。在数聚股份看来,一个数据仓库可以作为一个企业数据存储和管理系统,能够更有效地存储、管理和分析数据。那么,为什么要搭建数据仓库呢?
配置Kafka发送大消息
在本文中,我们介绍了配置调优Kafka选项以发送大于1MB的大消息。包括生产者端、主题、代理服务和消费者端的配置选项。其中一些选项是强制配置,一些是可选配置,虽然消费者配置是可选的,但可以避免负面的性能影响。最后,我们还介绍了发送大消息的其他可能选项。内容参考:[Send Large Message
2022 年首届“钉钉杯”大学生大数据挑战赛B题:航班数据分析与预测——国奖论文代码分享
随着民航事业的迅速发展飞机出行已成为未来发展的一种必然趋势,然而近年来, 航班延误现象频频发生,成为困扰机场和航空公司的难题。对航班延误做出合理评价是 分析航班延误总体水平、降低延误成本,以及制定相关处置预案的重要基础,有着重要 的现实运用价值。针对机场聚类分析问题的第一部分,首先按照题目要求的五种
Hbase Shell操作
Hbase Shell操作
解决Hive视图View数据乱码的问题
解决Hive视图View数据乱码的问题
Kafka运维监控:Kafka-Eagle安装
kafka自身并没有集成监控管理系统,因此对kafka的监控管理比较不便,好在有大量的第三方监控管理系统来使用,常见的有:Kafka Manager(雅虎开源的Kafka集群管理器)还有JMX接口自开发监控管理系统。
flink客户端提交任务报错
【代码】flink客户端提交任务报错。
Hive(25):Select高级查询之Subqueries子查询
1 from子句中子查询在Hive0.12版本,仅在FROM子句中支持子查询。而且必须要给子查询一个名称,因为FROM子句中的每个表都必须有一个名称。子查询返回结果中的列必须具有唯一的名称。子查询返回结果中的列在外部查询中可用,就像真实表的列一样。子查询也可以是带有UNION的查询表达式。Hive支
centos7安装rabbitmq
erl。
三、Kafka的消费全流程
我们接着继续去理解最后这条消息是如何被消费者消费掉的。其中最核心的有以下内容。1、多线程安全问题2、群组协调3、分区再均衡。
工业互联网和物联网有什么关系?
工业互联网是基于物联网发展起来的,或者说是以物联网为基础,是IT/CT/OT融合的一体化工业系统,所以又有别于物联网,下面详细来讲解下。工业互联网就是要实现物理形式的企业在数字空间的投射,并基于此来实现的以人机物(Human,Machines,Things)泛在互联为基础上,深度感知为支撑,智能决策
Cannot safely cast ‘createtime‘: string to timestamp;
ANSI 策略(),不允许 Spark 进行某些不合理的类型转换,如:string 转换成 timestamp。LEGACY 策略,允许 Spark 进行类型强制转换,只要它是有效的 Cast 操作。SQL 增加了一个安全策略,不对非同类型的数据进行强制转换,然后就会出现这个错误。STRICT 策略
聊聊hdfs中的rpc问题
hdfs中的rpc问题
记一次rabbitmq消息发送成功,消费丢失问题
Trace 是Rabbitmq用于记录每一次发送的消息,方便使用Rabbitmq的开发者调试、排错。可通过插件形式提供可视化界面。
springboot集成flink步骤,及demo
springboot集成flink步骤,及demo
Flink(一)1.12.7或1.13.5详细介绍及本地安装部署、验证
本示例以1.12版本进行介绍,当前版本更新至1.17。Flink 诞生于欧洲的一个大数据研究项目 StratoSphere。该项目是柏林工业大学的一个研究性项目。早期, Flink 是做 Batch 计算的,但是在 2014 年, StratoSphere 里面的核心成员孵化出 Flink,同年将
什么是HBase
HBase是一个基于Hadoop的分布式列式存储系统,可以存储非结构化和半结构化的大数据,具有高可用性、高扩展性、高性能等特点,常用于大规模实时数据处理。
RocketMQ源码分析
RocketMQ源码分析