大数据 - overfit.cn

车路云一体化是什么？

“车路云一体化”是指在智能交通系统中，车辆、道路基础设施和云计算平台之间的深度融合与协同工作。这种系统的目标是通过实时的数据采集、传输和处理，提高交通效率、安全性和用户体验。以下是车路云一体化的几个关键要素：智能车辆：配备了传感器、摄像头、GPS和通信设备，可以实时收集自身状态和周围环境的数据。这些

overfit同步小助手 2024-09-29 13:03:38 0 收藏

大数据新视界 --大数据大厂之数据压缩算法比较与应用：节省存储空间

本文深入探讨了大数据中数据压缩算法的重要性，详细比较了常见的无损（GZIP、ZIP）和有损（JPEG、MP3）压缩算法在压缩率、速度、适用场景方面的差异，并结合丰富的实际案例阐述了它们在大数据厂的数据存储和传输中的应用，还对数据压缩技术未来的发展趋势进行了全面分析。

overfit同步小助手 2024-09-29 08:03:18 0 收藏

Git的入门基础使用方法

git clone的同时会remote与远程库建立连接，reo在文件夹里面。rm -rf .git强制删除库远程仓库和本地库文件不匹配也无法上传删除本地库和远程库是完全不同的操作git的操作是上工上岗的基本功，每个计算机的学习者都需要扎实掌握，也有图形化的GitHub desktop，使用感觉其实还

overfit同步小助手 2024-09-29 06:05:39 0 收藏

保姆级教程教你如何安装Hadoop，实现Hadoop单机（非分布式）配置

前往阿里镜像站选择下载下载时间较久，请耐心等待。

overfit同步小助手 2024-09-29 06:04:58 0 收藏

大数据-146 Apache Kudu 安装运行 Dockerfile 模拟集群启动测试

本节对 Apache Kudu 进行部署，通过Docker Compose 配置文件，用于部署 Apache Kudu 集群。Apache Kudu 是一个用于快速分析和实时数据处理的分布式列式存储系统，常与 Apache Hadoop 生态系统中的其他组件（如 Apache Impala、Apac

overfit同步小助手 2024-09-29 06:04:36 0 收藏

30分钟掌握沧湖一体化：flink+hudi（干货，建议收藏）_flink hudi sink

之所以数据先入 Kafka 而不是直接入 Hudi，是为了实现多个实时任务复用 MySQL 过来的数据，避免多个任务通过 Flink CDC 接 MySQL 表以及 Binlog，对 MySQL 库的性能造成影响。再者，如果把大量的历史数据再一次推到 Kafka，走实时计算的链路来修正历史数据，可能

overfit同步小助手 2024-09-29 05:03:53 0 收藏

大数据-111 Flink 安装部署 YARN部署模式 FlinkYARN模式申请资源、提交任务

点一下关注吧！！！非常感谢！！持续更新！！！目前已经更新到了：Hadoop(已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis (已更完)Kafka(已更完)Spark(已更完)F

overfit同步小助手 2024-09-29 05:03:49 0 收藏

Paimon 集成Flink CDC (二） Kafka

Flink提供了几种KafkaCDC格式:canal-json、debezium-json、ogg-json、maxwell-json。如果Kafka主题中的消息是使用更改数据捕获(CDC）工具从另一个数据库捕获的更改事件，则可以使用Paimon 的KafkaCDC。将解析后的INSERT、UPDA

overfit同步小助手 2024-09-29 05:03:32 0 收藏

如何保证综合管廊安全、稳定的运行及工人生命安全

近年来，随着我国综合管廊建设水平的不断提升，已经取得良好的建设效果，但是在城市综合管廊建设过程中，由于建设经验不足，导致综合管廊建设运营还存在一些问题，因此为了保证综合管廊能够安全运行，还应设置专门的监控系统和安防系统，通过收集综合管廊运营的相关信息，及时的发现和解决综合管廊运行过程中存在的问题，做

overfit同步小助手 2024-09-29 03:07:44 0 收藏

大数据基础

Volume（体量大）Velocity（速度快）和Variety（种类多）。它指的是数据集的规模、增长速度和多样性，这些数据集太大或复杂，传统的数据处理软件难以处理。大数据是一个快速发展的领域，它为组织提供了前所未有的机会来从海量数据中提取有价值的见解。随着技术的进步，大数据的应用将更加广泛，对个人

overfit同步小助手 2024-09-29 02:04:26 0 收藏

Flink SQL 中枚举类型处理的挑战与解决方案

在 Flink SQL 中处理枚举类型的数据可能会遇到一些限制，特别是在无法调用 Java 方法的情况下。数据预处理：在 Kafka 数据源处将枚举类型转换为字符串。CASE语句：在 Flink SQL 中使用CASE语句进行枚举值的映射，适用于较简单的场景。字符串替换：对于简单的枚举字符串，可以使

overfit同步小助手 2024-09-29 01:04:14 0 收藏

解决高版本flink cdc connector缺少依赖的问题

解决高版本flink cdc依赖缺失的问题

overfit同步小助手 2024-09-29 00:03:46 0 收藏

银河麒麟（Kylin Linux Advanced Server V10）配置centos8的yum源

3、将阿里云开源镜像站的centos8的yum源，下载到麒麟的服务器下并重新加载。1、虚拟机安装麒麟操作系统（此步骤忽略）。2、将麒麟的yum源备份。4、测试使用yum安装服务。

overfit同步小助手 2024-09-28 23:06:53 0 收藏

Hadoop大数据集群搭建

广东东软学院学子，云计算实验一，Hadoop集群搭建，需要的可以参考，或者私聊我解决问题，希望可以帮到大家

overfit同步小助手 2024-09-28 17:03:38 0 收藏

Git 分支策略-选择适合团队的工作流程

Git Flow 是 Vincent Driessen 于 2010 年提出的分支模型。它基于两个长期分支（master和develop），并引入了多个短期分支用于不同的开发任务。不同的 Git 分支策略适合不同规模的团队和项目需求。通过分析 Git Flow、GitHub Flow 和 Trunk

overfit同步小助手 2024-09-28 16:05:45 0 收藏

Flink CDC 在货拉拉的落地与实践

今天的文章撰写自陈政羽老师在 Apache Asia Community Over Code 2024 上的分享《货拉拉在 Flink CDC 生产实践落地》，系统地介绍货拉拉的业务背景，技术选型，整体能力构建与收益，最后分享了开源参与以及开展的未来工作和期望。

overfit同步小助手 2024-09-28 16:03:53 0 收藏

大数据-148 Apache Kudu 从 Flink 下沉数据到 Kudu

将数据从 Apache Flink 下沉到 Kudu 是一个常见的场景，可以利用 Kudu 的高性能和灵活性进行实时数据存储和分析。将编写代码展示了如何从数据源读取数据、进行转换，并最终将结果写入 Kudu。需要确保 MyFlinkSinkToKudu 类的实现是正确的，以便顺利将数据存储到 Kud

overfit同步小助手 2024-09-28 15:06:17 0 收藏

梧桐数据库大数据实时查询场景性能测试报告

梧桐数据库

overfit同步小助手 2024-09-28 15:03:56 0 收藏

全国职业院校技能大赛（大数据赛项）-平台搭建hive笔记

在大数据时代，数据量呈爆炸性增长，传统的数据处理工具已难以满足需求。Hive作为一个开源的数据仓库工具，能够处理大规模数据集，提供了强大的数据查询和分析能力，是大数据学习中的关键工具。在全国职业院校技能大赛（大数据技术与应用赛项）中的平台搭建模块，hive的搭建也是经常考察的问题，今天大家随着小编一

overfit同步小助手 2024-09-28 13:03:44 0 收藏

国庆旅游高峰期，景区如何利用可视化大屏保障游客安全？

国庆假期即将来临，中国文化和旅游部发布的数据显示，今年国庆期间国内旅游市场将迎来爆发式增长，预计出游人次将达到8.96亿，同比增长86%，旅游收入预计将达到7825亿元人民币，同比增长138%。这一繁荣景象无疑给各大景区带来了巨大的客流量和经济收益，但同时也带来了不小的安全管理挑战。在人潮涌动的旅游

overfit同步小助手 2024-09-28 11:08:32 0 收藏