大数据 - overfit.cn

大数据—MapReduce概念

Mapper函数是对输入数据进行处理的函数。它接收输入的数据记录，将其转化为(Key,Value)对，并输出到Reducer函数进行处理。你可以根据需求自定义Mapper函数。

overfit同步小助手 2024-09-26 12:03:47 0 收藏

探索高可用性的RabbitMQ客户端：Lyra

探索高可用性的RabbitMQ客户端：Lyra lyraHigh availability RabbitMQ client项目地址:https://gitcode.com/gh_mirrors/lyr/lyra 在分布式系统中，处理故障是不可避免的挑战。Lyra，作为一个高可用的RabbitMQ客户

overfit同步小助手 2024-09-26 12:03:30 0 收藏

WPF—LiveCharts图表

LiveCharts是一个简单灵活、交互式以及功能强大的跨平台图表库，支持wpf、winform...应用程序。

overfit同步小助手 2024-09-26 11:03:40 0 收藏

Kafka+PostgreSql，构建一个总线服务

实际上，我们的生产环境中，正正常运行的一套总线服务，依赖的是RabbitMQ和SQL Server，RabbitMQ还好，SQL Server在以后应该不会是做项目的首选数据库了，尤其是做一些高并发的项目，不是说它性能不够，而是成本太高，社区版的限制有太多，还是要早做规划，提前准备更加适合未来发展的

overfit同步小助手 2024-09-26 10:04:09 0 收藏

探索高性能数据处理的新境界：Apache Arrow Flight与Spark的完美融合

探索高性能数据处理的新境界：Apache Arrow Flight与Spark的完美融合 flight-spark-source 项目地址: h

overfit同步小助手 2024-09-26 09:04:06 0 收藏

探秘Apache Sling与Kafka的强强联合：打造高效内容分发新体验

探秘Apache Sling与Kafka的强强联合：打造高效内容分发新体验 sling-org-apache-sling-distribution-journal-kafkasling-org-apache-sling-distribution-journal-kafka 这是一个用于 Apache

overfit同步小助手 2024-09-26 09:03:31 0 收藏

Hadoop 2.7.3 for Windows 安装与使用指南

Hadoop 2.7.3 for Windows 安装与使用指南 hadoop-2.7.3_windows 项目地址: https://gitc

overfit同步小助手 2024-09-26 08:03:27 0 收藏

大数据新视界 --大数据大厂之大数据存储技术大比拼：选择最适合你的方案

本文深入探讨大数据存储技术，涵盖 HDFS、NoSQL 数据库和分布式对象存储。分析存储技术选择因素及未来混合存储、智能存储趋势，以金融、互联网等案例辅助说明，为读者选择大数据存储方案提供参考。

overfit同步小助手 2024-09-26 08:03:19 0 收藏

GEE数据集：采用精细分类系统的全球 30 米湿地地图数据集

GWL_FCS30 是分辨率为 30 米的全球湿地地图，旨在提供全球湿地生态系统的详细信息。该数据集的时间跨度为 2000 年至 2022 年，包含一个精细的分类系统，可区分八个特定的湿地子类别。该数据集中的沿海潮汐湿地分为红树林、盐沼和滩涂。内陆湿地的分类包括永久性水域、沼泽、沼泽、淹没滩涂和盐碱

overfit同步小助手 2024-09-26 07:04:16 0 收藏

Spark Extension 开源项目教程

Spark Extension 开源项目教程 spark-extensionA library that provides useful extensions to Apache Spark and PySpark.项目地址:https://gitcode.com/gh_mirrors/sp/spa

overfit同步小助手 2024-09-26 07:03:49 0 收藏

【Hadoop|HDFS篇】HDFS的Shell操作

40， 12， 52表示的都是文件大小，120表示的是40*3个副本，/sanguo表示查看的目录。（3）-chgrp，-chmod，-chown：与Linux系统中的用法一致，修改文件的权限。（2）-copyFromLocal：从本地文件系统拷贝文件到HDFS中。（4）-appendToFile：

overfit同步小助手 2024-09-26 06:04:41 0 收藏

如何基于Flink CDC与OceanBase构建实时数仓，实现简化链路，高效排查

本文将探讨Flink CDC与Apache Flink之间的关联与差异。更重要的是，我们将如何巧妙地将Flink CDC与OceanBase数据库相结合，构建一个实时数据仓库系统。

overfit同步小助手 2024-09-26 06:04:28 0 收藏

docker启动kafka并挂载配置文件，并让外部环境连接kafka

docker 启动 kafka 并挂载配置文件，并让外部环境连接 kafka

overfit同步小助手 2024-09-26 04:04:04 0 收藏

从AI到大数据，数字技术服务平台全栈赋能企业升级

海量的数据中蕴含着丰富的信息和价值，数字技术服务平台能够收集、整理和分析这些数据，为企业提供精准的市场洞察和决策支持。企业可以通过参加树莓集团举办的培训课程和研讨会，了解最新的数字技术趋势和应用案例，提升自身的数字技术水平。从技术咨询、解决方案设计到系统实施和运维，数字技术服务平台为企业提供一站式的

overfit同步小助手 2024-09-26 04:03:43 0 收藏

第2章 RabbitMQ 介绍

第一节 RabbitMQ 概念RabbitMQ 是一个消息中间件：它接受并转发消息。你可以把它当做一个快递站点，当你要发送一个包裹时，你把你的包裹放到快递站，快递员最终会把你的快递送到收件人那里，按照这种逻辑 RabbitMQ 是一个快递站，一个快递员帮你传递快件。RabbitMQ 与快递站的主要区

overfit同步小助手 2024-09-26 03:03:36 0 收藏

三.海量数据实时分析-FlinkCDC实现Mysql数据同步到Doris

通过上面的 route 配置，会将 app_db.orders 表的结构和数据同步到 ods_db.ods_orders 中。这样，就可以将诸如 app_db.order01、app_db.order02、app_db.order03 的表汇总到 ods_db.ods_orders 中。参考：htt

overfit同步小助手 2024-09-26 02:04:16 0 收藏

大数据-136 - ClickHouse 集群表引擎详解1 - 日志、Log、Memory、Merge

MergeTree 系列、Log 系列。ClickHouse 是一个列式数据库管理系统，支持多种表引擎，每种表引擎都有其特定的功能和用途。数据的存储方式和位置，写到哪里以及从哪里读取数据支持哪些查询以及如何支持并发数据访问索引的使用（如果存在）是否可以执行多线程请求数据复制参数ClickHouse

overfit同步小助手 2024-09-26 02:03:42 0 收藏

Linux安装数据服务-MySQL、Redis、Java、RabbitMQ、Elasticsearch、MongoDB

Linux安装部署MySQL、Linux安装部署Redis、Linux安装部署Java、Linux安装部署RabbitMQ、Linux安装部署Elasticsearch、Linux安装部署MongoDB

overfit同步小助手 2024-09-26 01:03:18 0 收藏

Kafka Connect MQTT 项目教程

Kafka Connect MQTT 项目教程 kafka-connect-mqttmqtt (source) conncetor for kafka项目地址:https://gitcode.com/gh_mirrors/ka/kafka-connect-mqtt 项目介绍Kafka Connect

overfit同步小助手 2024-09-25 23:04:08 0 收藏

全国职业院校技能大赛（大数据赛项）-平台搭建Spark、Scala笔记

然后我们复制conf目录下的workers.template文件，workers.template文件是一个模板文件，用于配置Spark集群中的工作节点，我们一般是将其复制为workers文件进行配置系列工作节点的主机名或IP地址，每行一个。将hive中conf下面的hive-site.xml传输到

overfit同步小助手 2024-09-25 23:03:49 0 收藏