大数据 - overfit.cn

SeaTunnel安装及测试

overfit同步小助手 2023-04-03 01:04:27 0 收藏

数据采集技术的方法有哪些?

pac

overfit同步小助手 2023-04-03 01:04:19 0 收藏

【机器学习之模型融合】Voting投票法基础理论

认识模型融合和投票法Voting

overfit同步小助手 2023-04-03 01:04:07 0 收藏

一文读懂TDengine的三种查询功能

为一款专业的时序数据库（Time Series Database，TSDB），为满足用户在不同场景下的查询需求，TDengine 提供了丰富的查询功能。除了一些主要的查询外，还包括多表聚合查询、降采样查询及连续查询，本文将从实际操作层面对这三种特殊查询进行解读。

overfit同步小助手 2023-04-03 01:03:57 0 收藏

ES选举：Elasticsearch中Master选举完全解读

Master选举的意义在于集群主节点在遭遇宕机时保障服务的可用性。理解选举机制及相关算法，有利于了解ES底层的高可用原理，并学习及借鉴其设计思想。理解`Master选举`的另一个重要原因是：其为 ES 常见面试题之一！本文我将结合Elasticsearch源码、文字、绘图的方式剖析Master选举的

overfit同步小助手 2023-04-03 00:04:54 0 收藏

Hive 分桶表及作用

**分区**提供一个隔离数据和优化查询的便利方式。不过，并非所有的数据集都可形成合理的分区。对于一张表或者分区，Hive 可以进一步组织成，也就是更为细粒度的数据范围划分；

overfit同步小助手 2023-04-03 00:04:51 0 收藏

【DataEase】零代码数据可视化分析工具的安装部署保姆级教程

近期，因为我要做大屏的数据可视化分析，所以我了解到了DataEase这一款数据可视化分析工具。这个工具和以往使用的echarts等图表库有和大的不同，它零代码就可以快速制作各种报表、仪表板，完成各种数据可视化以及工作汇报。官方并没有出这个工具的安装教程，只有一个文档。虽然大部分人看官方文档来安装也可

overfit同步小助手 2023-04-03 00:04:44 0 收藏

数据开发总结

涵盖较多面经

overfit同步小助手 2023-04-03 00:04:34 0 收藏

大数据必知必会之Kafka

Kafka 起初是由 LinkedIn 公司采用 Scala 语言开发的一个多分区、多副本且基于 ZooKeeper 协调的分布式消息系统，现已被捐献给 Apache 基金会。目前 Kafka 已经定位为一个分布式流式处理平台，它以高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性而被广泛使用

overfit同步小助手 2023-04-03 00:04:27 0 收藏

查看HDFS集群状态

通过UI界面查看hadoop运行状态

overfit同步小助手 2023-04-03 00:04:22 0 收藏

Hive拉链表

使用HQL写一个Hive On Tez任务，以便跑出拉链表数据

overfit同步小助手 2023-04-03 00:04:01 0 收藏

【实战讲解】数据血缘落地实施

在复杂的社会分工协作体系中，我们需要明确个人定位，才能更好的发挥价值，数据也是一样，于是，数据血缘应运而生。今天这篇文章会全方位的讲解数据血缘，并且给出具体的落地实施方案。........................

overfit同步小助手 2023-04-02 23:04:41 0 收藏

【AI 写作】《开发者思维：技术如何驱动企业的未来》全书目录、什么是开发者思维？开发者思维与企业战略的关系？

开发者思维是指具备开发者所需的思维能力和习惯，能够熟练掌握各种开发工具和技能，能够认真分析问题、解决问题、优化问题的一种思维方式和状态。开发者思维的特点包括专注、严谨、创新、实践和团队合作能力。买馒头晚上老婆在做饭让我出去买几个馒头，去之前就要先确认：买几个?馒头没有了咋办?都没有了买啥?既然已经开

overfit同步小助手 2023-04-02 23:04:35 0 收藏

RSTP介绍

快速生成树协议RSTP（Rapid Spanning-Tree Protocol），RSTP在STP基础上进行了改进，实现了网络拓扑快速收敛。本文主要介绍RSTP的原理和配置

overfit同步小助手 2023-04-02 23:04:30 0 收藏

Kafka 集群安装

编辑config目录下的server.properties文件，在不同的节点只需要更改不同的host.name和broker.id。1. 将kafka安装包上传到服务器的/opt/apps目录下。5. 启动kafka（先启动zookeeper集群）二、安装zookeeper集群。到此kafka集群安

overfit同步小助手 2023-04-02 23:04:27 0 收藏

大数据系统架构-MPP数据库架构

MPP数据库架构

overfit同步小助手 2023-04-02 23:04:19 0 收藏

大数据Flink进阶（十）：Flink集群部署

在Flink1.8版本后不再支持基于不同Hadoop版本的编译安装包，Flink与Hadoop进行整合时，需要在官网中下载对应的Hadoop版本的"flink-shaded-hadoop-2-uber-x.x.x-x.x.jar"jar包，然后后上传到提交Flink任务的客户端对应的$FLINK_H

overfit同步小助手 2023-04-02 23:04:16 0 收藏

林子雨大数据技术原理与运用期末复习

大数据预处理方法包括___数据清洗___、___数据集成_____、___数据变换___和___数据规约_____。

overfit同步小助手 2023-04-02 23:04:01 0 收藏

Vue生命周期钩子剖析（共12个钩子）

Vue生命周期钩子剖析，告别一知半解

overfit同步小助手 2023-04-02 23:03:20 0 收藏

Kafka集群部署与测试

Kafka集群部署与测试安装Kafka①、Alt+P 拷贝安装包 cd /opt/moduletar -zxvf /opt/software/kafka_2.11-2.0.0.tgz -C /opt/module/②、修改配置文件vi /opt/module/kafka_2.11-2.0.0/co

overfit同步小助手 2023-04-02 22:04:48 0 收藏