大数据 - overfit.cn

[Hive的基本概念之---数据库 ]

《咏柳》唐·贺知章碧玉妆成一树高，万条垂下绿丝绦。不知细叶谁裁出，二月春风似剪刀。

overfit同步小助手 2023-08-03 21:04:23 0 收藏

CDH6.3.2-组件安装&安全认证

overfit同步小助手 2023-08-03 20:04:03 0 收藏

ElasticSearch第十五讲 ES数据写入过程和写入原理以及数据如何保证一致性

overfit同步小助手 2023-08-03 19:04:22 0 收藏

大数据技术之Hadoop学习(七)——Hive数据仓库

Hive数据仓库的认识与操作

overfit同步小助手 2023-08-03 18:04:12 0 收藏

从0到1搭建数据仓库流程

数仓搭建流程

overfit同步小助手 2023-08-03 17:04:16 0 收藏

Flink CDC2.4 整库实时同步MySql 到Doris

mysql 到doris的数据、表结构实时同步

overfit同步小助手 2023-08-03 16:04:14 0 收藏

全国范围2012-2022年POI数据集（shp格式)

中国五批国家级非物质文化遗产空间分布数据集是基于国务院2006、2008、2011、2014和2021年先后五次发布的3610个国家级非物质文化遗产代表性项目名录，按申报地区或单位的空间地理位置研发的数据集。该数据集包括3610个非遗项目的地理位置、编号、名称、类别、公布时间、类型、申报地区或单位、

overfit同步小助手 2023-08-03 15:04:24 0 收藏

大数据入门之Presto/Trino

Presto是由Facebook开发的分布式sql查询引擎，用来进行高速、实时的数据查询。

overfit同步小助手 2023-08-03 10:04:20 0 收藏

hadoop -- Yarn资源管理

Container是YARN中的资源抽象，它封装了某个节点上的多维度资源，如内存、CPU、磁盘、网络等，当AM向RM申请资源时，RM为AM返回的资源便是用Container表示。NM是每个节点上的资源和任务管理器，一方面，它会定时地向RM汇报本节点上的资源使用情况和各个Container的运行状态；

overfit同步小助手 2023-08-03 09:04:29 0 收藏

Kafka消费者详解

overfit同步小助手 2023-08-03 07:04:14 0 收藏

Doris 入门：高级特性（四）

目录一、表结构变更二、Rollup三、增大内存四、修改超时时间五、Broadcast/Shuffle Join六、数据模型七、索引八、物化视图九、动态分区十、数据导出十一、Colocation Join十二、SQL 函数一、表结构变更添加列：alter table table1 add column

overfit同步小助手 2023-08-03 07:04:07 0 收藏

Failed to send data to Kafka

kafka 异常

overfit同步小助手 2023-08-03 06:04:25 0 收藏

elasticsearch 之 updateByQuery

elasticsearch 之 updateByQuery ，通过script脚本完成对文档字段的更新

overfit同步小助手 2023-08-03 04:04:09 0 收藏

logstash连接elasticsearch被拒绝，如何解决-

账号密码都配置正确了，但是还是连接不上。

overfit同步小助手 2023-08-03 03:04:28 0 收藏

大数据Flink（五十二）：Flink中的批和流以及性能比较

Spark和Flink全部都运行在Hadoop YARN上，性能为Flink > Spark > Hadoop(MR)，迭代次数越多越明显，性能上，Flink优于Spark和Hadoop最主要的原因是Flink支持增量迭代，具有对迭代自动优化的功能。也即是有明确的开始和结束的定义。注入的顺序不是必须

overfit同步小助手 2023-08-03 03:04:22 0 收藏

【大数据】通过 docker-compose 快速部署 MinIO 保姆级教程

MinIO 是一个开源的对象存储服务器，它兼容Amazon S3（Simple Storage Service）API。它被设计用于构建分布式存储架构，提供高可用性、高性能和可扩展的对象存储解决方案。

overfit同步小助手 2023-08-03 00:04:41 0 收藏

Flink 状态后端

状态后端 (state backend) : 负责管理本地状态的存储方式, 位置。

overfit同步小助手 2023-08-02 23:04:38 0 收藏

ElasticSearch 部署及安装ik分词器

公司es集群现以三个角色部署分别为 Gateway、Master、Data 简单的理解可以理解为在每台机器上部署了三个es，以端口和配置文件来区分这三个es不同的功能。我们知道本来安装分词器是件特别简单的事网上的教程也是一大片一大片的，在我们的环境和架构下在es 5.5版本之后就不需要修改es的配置

overfit同步小助手 2023-08-02 20:04:14 0 收藏

吴恩达《ChatGPT Prompt Engineering for Developers》【自用】

作者吴恩达教授欢迎来到本课程，我们将为开发人员介绍 ChatGPT 提示工程。本课程由 Isa Fulford 教授和我一起授课。Isa Fulford 是 OpenAI 的技术团队成员，曾开发过受欢迎的 ChatGPT 检索插件，并且在教授人们如何在产品中使用 LLM 或 LLM 技术方面做出了

overfit同步小助手 2023-08-02 17:04:51 0 收藏

elasticsearch目录及配置参数说明

overfit同步小助手 2023-08-02 15:04:15 0 收藏