Python获取全部股票数据
使用Python获取股票数据
Google Earth Engine(GEE)计算热度(LST)
今天来分享一下如何在GEE中计算热度,用地表温度来反演LST
解决Dolphinscheduler跨任务流依赖
解决Dolphinscheduler跨任务流依赖
Linux Ubuntu安装RabbitMQ服务
RabbitMQ是一个在 AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。由erlang开发的AMQP(Advanced Message Queue 高级消息队列协议 )的开源实现,由于erlang 语言的高并发特性,性能较好,本质是个队列,FIFO 先
【大数据Hive】Hive 内部表与外部表使用详解
Hive 内部表与外部表使用详解
2022年国家社会/自然科学基金立项名单
2022年国家社会科学+自然科学基金立项名单
什么是存算分离架构?
随着硬件技术的快速进步,尤其是网络和存储设备的性能迅速提升,以及云计算厂商推动软硬件协同加速的云存储服务,越来越多的企业开始基于云存储来构建数据存储服务,或数据湖,因此就需要单独再建设一个独立的计算层来提供数据分析服务,这也就是存算分离架构(Disaggregated Storage and Com
数据血缘Atlas Rest-API使用
Type即元数据类型定义,这里可以是数据库、表、列等,还可以细分spark表(spark_table),hive表(hive_table)等,atlas自带了很多类型,如DataSet,Process等,一般情况下,数据相关的类型在定义类型的时候都会继承DataSet,而流程相关的类型则会继承Pro
Offset Explorer中添加Kafka连接
offset explorer中Kafka链接
Hive--临时表的三种方式
一、临时数据方案1、with as1.1 使用demo witht1as( select imei ,src_pkg ,src_type ,app_version_name frombi_quickgame.dw_qgcrpk_boot_di whereday='${
什么是kafka,如何学习kafka,整合SpringBoot
什么是kafka,如何学习kafka,整合SpringBoot
大数据ETL工具对比(Sqoop, DataX, Kettle)
DataX和Kettle都是通用的数据集成工具,支持多种数据源和目标,提供了强大的数据转换和清洗功能。DataX和Kettle的区别在于开发者和用户群体,DataX在阿里巴巴内部得到广泛应用,而Kettle则是一个独立的开源项目。Sqoop主要用于Hadoop和关系型数据库之间的数据传输,适用于大规
RabbitMQ多消费者实例时,保证只有一个消费者进行消费(单活消费者模式)
rabbitmq多实例单活消费者
hive、pg库,建表语句及查询表结构语句
hive、pg库,建表语句及查询表结构语句
【Elasticsearch教程8】Mapping字段类型之keyword
Elasticsearch keyword constant_keyword wildcard类型
Flink CDC 2.4 正式发布,新增 Vitess 数据源,更多连接器支持增量快照,升级 Debezium 版本
Flink CDC [1] 是基于数据库的日志 CDC 技术,实现了全增量一体化读取的数据集成框架。配合 Flink 优秀的管道能力和丰富的上下游生态,Flink CDC 可以高效实现海量数据的实时集成。
大数据存储系统HDFS和对象存储(OOS/S3)的比较
虽然Apache Hadoop以前都是使用HDFS的,但是当Hadoop的文件系统的需求产生时候也能使用S3。Netflix的利用这个特性把数据存储在S3上而不是HDFS上。笔者曾经工作经历的大数据集群存储都是用HDFS,当前工作接触到对象存储S3,在实践中比较两者的不同之处。
【排错/运维】修复HDFS丢失、损坏以及副本数的问题
【排错/运维】修复HDFS丢失、损坏以及副本数的问题
Kafka 可视化工具 Kafka Tool
Kafka 可视化工具 Kafka Tool
linux部署rabbitmq开启mqtt插件由于监听1883端口导致重启rabbitmq失败的解决方法
linux部署rabbitmq开启mqtt插件由于监听1883端口导致重启rabbitmq失败的解决方法