大数据 - overfit.cn

Hbase

HBase 基于 Google的BigTable论文而来，是一个分布式海量列式非关系型数据库系统，可以提供超大规模数据集的实时随机读写。

overfit同步小助手 2024-05-26 06:03:43 0 收藏

kaggle最全基础入门（大数据）

Kaggle是一个数据科学竞赛平台，旨在连接数据科学家和机器学习工程师，提供一个共同解决实际问题的平台。Kaggle的任务通常由公司、学术机构、政府机构等提交，这些任务涵盖了各种问题领域，例如自然语言处理、计算机视觉、数据挖掘等。竞赛参与者可以下载数据集、提交代码和模型，并与其他参赛者交流和竞争。K

overfit同步小助手 2024-05-26 05:03:57 0 收藏

Hadoop核心技术

Hadoop生态系统是一个开源的分布式计算平台，由Apache软件基金会开发并维护。其核心组件主要包括HDFS（Hadoop Distributed File System，Hadoop分布式文件系统）、MapReduce以及YARN（Yet Another Resource Negotiator，

overfit同步小助手 2024-05-26 05:03:41 0 收藏

flink cdc，读取datetime类型

需要注意的是，如果您使用的是Flink 1.13或以上版本，可以直接使用Flink的内置Debezium插件来实现CDC任务，无需安装其他插件。Flink CDC读取MySQL的datetime类型时会转换为时间戳的问题，可以通过在Flink CDC任务中添加相应的转换器来解决。- 使用 Flink

overfit同步小助手 2024-05-26 05:03:30 0 收藏

【git系列】 git-clone含义用法选项示例详解

overfit同步小助手 2024-05-26 04:04:29 0 收藏

【Hadoop】-HDFS的Shell操作[3]

Hadoop Distributed File System (HDFS) 是一个分布式文件系统，用于存储和处理大规模数据集。HDFS具有高可扩展性、高容错性和高吞吐量的特点，是Apache Hadoop框架的核心组件之一。HDFS提供了一个命令行界面（Shell），用于管理和操作文件系统中的文件和

overfit同步小助手 2024-05-26 04:03:26 0 收藏

架构设计方法（4A架构）-业务架构

依据企业架构标准组织The Open Group的定义，企业架构描述构成企业的要素和要素之间关系，以及用于管控架构设计和演进的原则和指引。1、价值流是一组端到端的活动集合，能够为外部客户或内部用户创造一个有价值的结果。2、有别于流程，主要描述企业为他的客户创造什么价值以及如何创造价值。1、业务能力定

overfit同步小助手 2024-05-26 03:02:27 0 收藏

用海豚调度器定时调度从Kafka到HDFS的kettle任务脚本

工作流启动，成功！工作流一直在跑相应的任务实例也在跑！

overfit同步小助手 2024-05-26 01:03:56 0 收藏

ZooKeeper详解

ZooKeeper作用举例设计原理Znodes的状态变化具体步骤ZooKeeper原理ZooKeeper数据结构(了解)ZooKeeper CLIZookeeper角色ZooKeeper选举机制半数机制leader选举触发时机补充

overfit同步小助手 2024-05-26 01:03:52 0 收藏

【Hadoop】--基于hadoop和hive实现聊天数据统计分析，构建聊天数据分析报表[17]

BI：Business Intelligence，商业智能。指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行分析以实现商业价值。简单来说，就是借助BI工具，可以完成复杂的数据分析、数据统计等需求，为公司决策带来巨大的价值。所以，一般提到BI，我们指代的就是工具软件。FineBISu

overfit同步小助手 2024-05-26 00:04:00 0 收藏

大数据分层存储架构：ODS、DWD、DWM与DWS详解

通过这种分层存储结构，大数据系统可以更好地满足不同层次的数据需求，提高数据处理和分析的效率。同时，各层之间的数据流动和交互也变得更加清晰和可控，有助于减少数据冗余和错误，提高数据质量。在大数据领域中，ODS、DWD、DWM和DWS代表了数据仓库的不同层次，它们共同构成了大数据的分层存储结构。这种结构

overfit同步小助手 2024-05-26 00:03:50 0 收藏