大数据 - overfit.cn

Python获取全部股票数据

使用Python获取股票数据

overfit同步小助手 2023-07-16 12:04:14 0 收藏

Google Earth Engine（GEE）计算热度（LST）

今天来分享一下如何在GEE中计算热度，用地表温度来反演LST

overfit同步小助手 2023-07-16 11:03:57 0 收藏

解决Dolphinscheduler跨任务流依赖

解决Dolphinscheduler跨任务流依赖

overfit同步小助手 2023-07-16 10:03:52 0 收藏

Linux Ubuntu安装RabbitMQ服务

RabbitMQ是一个在 AMQP(高级消息队列协议)基础上完成的，可复用的企业消息系统，是当前最主流的消息中间件之一。由erlang开发的AMQP（Advanced Message Queue 高级消息队列协议）的开源实现，由于erlang 语言的高并发特性，性能较好，本质是个队列，FIFO 先

overfit同步小助手 2023-07-16 09:03:43 0 收藏

【大数据Hive】Hive 内部表与外部表使用详解

Hive 内部表与外部表使用详解

overfit同步小助手 2023-07-16 08:03:44 0 收藏

2022年国家社会/自然科学基金立项名单

2022年国家社会科学+自然科学基金立项名单

overfit同步小助手 2023-07-16 07:04:16 0 收藏

什么是存算分离架构？

随着硬件技术的快速进步，尤其是网络和存储设备的性能迅速提升，以及云计算厂商推动软硬件协同加速的云存储服务，越来越多的企业开始基于云存储来构建数据存储服务，或数据湖，因此就需要单独再建设一个独立的计算层来提供数据分析服务，这也就是存算分离架构（Disaggregated Storage and Com

overfit同步小助手 2023-07-16 05:04:21 0 收藏

数据血缘Atlas Rest-API使用

Type即元数据类型定义，这里可以是数据库、表、列等，还可以细分spark表(spark_table)，hive表(hive_table)等，atlas自带了很多类型，如DataSet，Process等，一般情况下，数据相关的类型在定义类型的时候都会继承DataSet，而流程相关的类型则会继承Pro

overfit同步小助手 2023-07-15 21:04:10 0 收藏

Offset Explorer中添加Kafka连接

offset explorer中Kafka链接

overfit同步小助手 2023-07-15 20:04:44 0 收藏

Hive--临时表的三种方式

一、临时数据方案1、with as1.1 使用demo witht1as( select imei ,src_pkg ,src_type ,app_version_name frombi_quickgame.dw_qgcrpk_boot_di whereday='${

overfit同步小助手 2023-07-15 20:04:39 0 收藏

什么是kafka，如何学习kafka，整合SpringBoot

什么是kafka，如何学习kafka，整合SpringBoot

overfit同步小助手 2023-07-15 19:04:27 0 收藏

大数据ETL工具对比（Sqoop, DataX, Kettle）

DataX和Kettle都是通用的数据集成工具，支持多种数据源和目标，提供了强大的数据转换和清洗功能。DataX和Kettle的区别在于开发者和用户群体，DataX在阿里巴巴内部得到广泛应用，而Kettle则是一个独立的开源项目。Sqoop主要用于Hadoop和关系型数据库之间的数据传输，适用于大规

overfit同步小助手 2023-07-15 19:04:13 0 收藏

RabbitMQ多消费者实例时，保证只有一个消费者进行消费（单活消费者模式）

rabbitmq多实例单活消费者

overfit同步小助手 2023-07-15 19:03:48 0 收藏

hive、pg库，建表语句及查询表结构语句

hive、pg库，建表语句及查询表结构语句

overfit同步小助手 2023-07-15 16:04:29 0 收藏

【Elasticsearch教程8】Mapping字段类型之keyword

Elasticsearch keyword constant_keyword wildcard类型

overfit同步小助手 2023-07-15 13:03:49 0 收藏

Flink CDC 2.4 正式发布，新增 Vitess 数据源，更多连接器支持增量快照，升级 Debezium 版本

Flink CDC [1] 是基于数据库的日志 CDC 技术，实现了全增量一体化读取的数据集成框架。配合 Flink 优秀的管道能力和丰富的上下游生态，Flink CDC 可以高效实现海量数据的实时集成。

overfit同步小助手 2023-07-15 13:03:44 0 收藏

大数据存储系统HDFS和对象存储(OOS/S3)的比较

虽然Apache Hadoop以前都是使用HDFS的，但是当Hadoop的文件系统的需求产生时候也能使用S3。Netflix的利用这个特性把数据存储在S3上而不是HDFS上。笔者曾经工作经历的大数据集群存储都是用HDFS，当前工作接触到对象存储S3，在实践中比较两者的不同之处。

overfit同步小助手 2023-07-15 12:04:06 0 收藏

【排错/运维】修复HDFS丢失、损坏以及副本数的问题

【排错/运维】修复HDFS丢失、损坏以及副本数的问题

overfit同步小助手 2023-07-15 09:04:20 0 收藏

Kafka 可视化工具 Kafka Tool

Kafka 可视化工具 Kafka Tool

overfit同步小助手 2023-07-15 08:04:29 0 收藏

linux部署rabbitmq开启mqtt插件由于监听1883端口导致重启rabbitmq失败的解决方法

linux部署rabbitmq开启mqtt插件由于监听1883端口导致重启rabbitmq失败的解决方法

overfit同步小助手 2023-07-15 07:03:52 0 收藏

733
734
735
736
737
738
739
740
741
742

登录可以使用的更多功能哦！登录

BI Flink Hadoop Hive MPP Scala Spark 数据仓库

作者榜

资讯小助手

资讯同步

内容小助手

文章同步

Deephub

公众号：deephub-imba

奕凯

公众号：奕凯的技术栈