大数据 - overfit.cn

开启hadoop的命令和方法

要开启 Hadoop，你需要进入 Hadoop 的安装目录，然后输入以下命令：sbin/start-dfs.shsbin/start-yarn.sh这会启动 Hadoop 的两个核心组件：Hadoop Distributed File System (HDFS) 和 Yet Another Reso

overfit同步小助手 2023-07-28 09:04:19 0 收藏

rabbitmq 开启 virtual host

由于我的rabbitmq架设在测试服务期。导致我本地测试的mq消息，经常被服务器消费掉。所以通过添加v-host，可以创建专属v-host域下的消息进行生产和消费。

overfit同步小助手 2023-07-28 09:04:05 0 收藏

【docker深入浅出】一文学透Docker基础万字好文

Docker 最初是dotCloud公司创始人Solomon Hykes在法国期间发起的一个公司内部项目，它是基于dotCloud公司多年云服务技术的一次革新，并与2013年3月以Apache 2.0授权协议开源），主要项目代码在GitHub上进行维护。Docker项目后来还加入了Linux基金会，

overfit同步小助手 2023-07-28 08:03:52 0 收藏

java:Kafka生产者推送数据与消费者接收数据（参数配置以及案例）

java kafka 生产者消费者配置以及参考

overfit同步小助手 2023-07-28 04:04:25 0 收藏

【Hadoop 01】简介

Hadoop适合海量数据分布式存储和分布式计算Java改为支持8及以上HDFS支持纠删码HDFS支持多NameNodeMR任务级本地优化多重服务默认端口变更Hadoop主要包含三大组件：HDFS+MapReduce+YARNHDFS负责海量数据的分布式存储MapReduce是一个计算模型，负责海量

overfit同步小助手 2023-07-28 04:04:02 0 收藏

docker-compose 安装 Kafka 3.X 附带可视化界面

overfit同步小助手 2023-07-28 04:03:54 0 收藏

数据中台OneID：详解ID-Mapping！

ID-Mapping，一文搞定

overfit同步小助手 2023-07-28 00:04:28 0 收藏

sql数据类型映射与数据类型转换

MaxCompute 2.0新增了DECIMAL类型与DATETIME的常量定义方式，100BD是数值为100的DECIMAL，2017-11-11 00:00:00是DATETIME类型的常量。关于CAST的介绍请参见CAST。关系运算符包括=、<>、<、<=、>、>=、IS NULL、IS NO

overfit同步小助手 2023-07-27 23:04:19 0 收藏

Window下搭建kafka运行环境

overfit同步小助手 2023-07-27 21:04:26 0 收藏

【hadoop】Linux安装和配置

安装和配置Linux，修改时间2023/7/5

overfit同步小助手 2023-07-27 21:04:15 0 收藏

DataX mysql同步到mysql

使用Datax web创建同步任务

overfit同步小助手 2023-07-27 20:04:20 0 收藏

ThingsBoard调试部署和性能分析

Thingsboard部署、前端调试部署，开源系统的性能分析

overfit同步小助手 2023-07-27 17:04:19 0 收藏

Flink CDC、OGG、Debezium等基于日志开源CDC方案对比

CDC 的全称是，在广义的概念上，只要能捕获数据变更的技术，我们都可以称为 CDC。我们目前通常描述的CDC 技术主要面向数据库的变更，是一种用于捕获数据库中数据变更的技术。

overfit同步小助手 2023-07-27 17:04:16 0 收藏

Flink Direct Reader访问Hive ACID表被ranger授权限制

Flink Direct Reader 绕过了 Hive Thrift 接口，直接读取 Hive ACID 表的数据文件，因此无法受到 Ranger 的授权限制。要在受到 Ranger 鉴权的环境中访问 Hive ACID 表，可以考虑使用 Hive Thrift 接口或配置适当的 Ranger 授

overfit同步小助手 2023-07-27 15:04:10 0 收藏

Zookeeper 节点权限控制ACL详解

Zookeeper可以使用ACL（access control list）访问控制列表来对节点的权限进行控制

overfit同步小助手 2023-07-27 14:04:20 0 收藏

Hive 窗口函数大全

hive的窗口函数使用集合和使用示例

overfit同步小助手 2023-07-27 14:04:14 0 收藏

Flink 保存点

保存点 (Savepoint) ：用户手动触发保存状态。savepoint 恢复作业, 并修改状态后端。checkpoint 恢复作业。优雅停止 , 并触发保存点。

overfit同步小助手 2023-07-27 13:03:55 0 收藏

开源分布式支持超大规模数据分析型数据仓库Apache Kylin实践-上

再下一城又一个实时多维交互式分析数仓利器，了解其特性和架构组成，进一步阐述相关概念和其生态圈；介绍作为开发测试最快捷方式的Docker单机部署；也基于Hadoop环境一步步部署最新v4.0.3二进制并解决遇到的问题，最后通过一个读取hive数据示例介绍kylin创建项目、选择数据源、创建Model、

overfit同步小助手 2023-07-27 12:04:40 0 收藏

配置Kettle连接大数据HDFS

如果需要使用HBase集群，hbase-site.xml文件也需要替换。2.ETL工具Kettle，版本：pdi-ce-7.0.0.0-25。3. Kettle连接HDFS需要替换的Hadoop文件。1.Hadoop集群,版本：Hadoop3.3.0。3.MySQL服务器，版本：mysql5.7.3

overfit同步小助手 2023-07-27 12:04:37 0 收藏

flink datastream api实现数据实时写入hudi

针对上述两种方式，我们可以发现其实都是大同小异的，最后都是调用的一段相同代码，都是相当灵活的。在使用过程中，可结合自己的业务场景分别选择。

overfit同步小助手 2023-07-27 12:04:34 0 收藏