大数据 - overfit.cn

大数据平台运维（hadoop入门（保姆篇））----概述及基本环境配置(HA-1)

大数据运维基础

overfit同步小助手 2023-06-03 15:03:49 0 收藏

分布式数据库（DorisDB、Clickhouse、TiDB）调研

分布式数据库

overfit同步小助手 2023-06-03 14:04:03 0 收藏

数字政府案例|广东省数据资源一网共享平台案例

四是数据类型丰富，包含了库表、接口、电子证照、电子地图、视频，提供库表、接口、文件、证照等多种数据提供方式；广东省数据资源一网共享平台目前已构建“数据编目挂接体系”、“数据共享交换体系”、“数据质量检测体系”、“数据加密解密体系”、“数据智能推荐体系”等18大省市一体化体系架构，通过统一技术标准、规

overfit同步小助手 2023-06-03 14:03:48 0 收藏

高性能分布式对象存储——MinIO实战操作（MinIO扩容）

MinIO 是在 GNU Affero 通用公共许可证 v3.0 下发布的高性能对象存储。它与 Amazon S3 云存储服务 API 兼容。使用 MinIO 为机器学习、分析和应用程序数据工作负载构建高性能基础架构。

overfit同步小助手 2023-06-03 14:03:39 0 收藏

Sqoop安装配置

sqoop安装配置

overfit同步小助手 2023-06-03 13:03:39 0 收藏

FlinkCDC 实时监控 MySQL

通过 FlinkCDC 实现 MySQL 数据库、表的实时变化监控，这里只把变化打印了出来，后面会实现如何再写入其他 MySQL 库中；

overfit同步小助手 2023-06-03 11:03:39 0 收藏

大数据处理——Java

Java是处理大数据的首选语言之一，它可以与Apache Hadoop和Spark等大数据处理框架集成。Java提供了处理大数据所需的可扩展性和灵活性。

overfit同步小助手 2023-06-03 10:03:56 0 收藏

大数据之Hadoop数据仓库Hive

Hive 是一个构建在 Hadoop 之上的数据仓库，它可以将结构化的数据文件映射成表，并提供类 SQL 查询功能，用于查询的 SQL 语句会被转化为 MapReduce 作业，然后提交到 Hadoop 上运行。简单、容易上手 (提供了类似 sql 的查询语言 hql)，使得精通 sql 但是不了解

overfit同步小助手 2023-06-03 04:03:35 0 收藏

Flutter教程之 Flutter 开发者的终极 Hive 数据库管理工具

这就是为什么我很高兴地宣布推出Flutter 的原因hive_ui，这是一个新的 Flutter 包，可以让您轻松管理 Hive 数据库。因此，如果您正在寻找一种管理 Hive 数据库的简单方法，请尝试使用 Hive UI，看看它如何帮助您更高效地工作。Hive UI 最好的事情之一是它是开源的并且

overfit同步小助手 2023-06-03 04:03:32 0 收藏

云计算与大数据实验五 MapReduce编程

函数的输入键，输入值，和输出键，输出值的类型。就第一关的例子来说，输入键是一个长整型，输入值是一行文本，输出键是单词，输出值是单词出现的次数。程序会对你编写的代码进行测试：输入已经指定了测试文本数据：需要你的程序输出合并去重后的结果。是一种可用于数据处理的编程模型，我们现在设想一个场景，你接到一个

overfit同步小助手 2023-06-03 02:04:00 0 收藏

powerdesigner下载安装教程

PowerDesigner是Sybase公司的CASE工具集，使用它可以方便地对管理信息系统进行分析设计，它几乎包括了数据库模型设计的全过程。利用PowerDesigner可以制作数据流程图、概念数据模型（ConceptualDataModel）、物理数据模型（PhysicalDataModel），

overfit同步小助手 2023-06-03 01:03:49 0 收藏

MQTT5.0新特性（比对3.1.1）

MQTT（MessageQueuingTelemetryTransport），即消息队列遥测传输协议，是一种基于发布/订阅的消息传输协议。其轻量、开放、简洁和易实现的特点能够适用于要求代码量小、网络带宽资源匮乏的情景，如机器间通信（M2M）、物联网等。...

overfit同步小助手 2023-06-03 01:03:30 0 收藏

【程序人生】纳瓦尔：确保稀缺性的最简单的方法就是这个东西来自你的个性 | 纳瓦尔宝典

纳瓦尔在《纳瓦尔宝典》这本书的后半部分，探讨了许多关于幸福人生的思考。他用格言式的思考加上循循善诱的解释来传递自己的幸福观和人生观，展示出了一种不同于传统思维的生活态度。这些观点虽然简洁明了，但是它们背后所蕴含的哲学思想却十分深刻。对于我们每个人来说，这些观点都具有重要的启示意义，帮助我们更好地追求

overfit同步小助手 2023-06-02 21:03:43 0 收藏

数据库审核工具SQLE部署及使用

点击上方蓝字关注我SQLE（ https://opensource.actionsky.com/sqle/ ）是由上海爱可生信息技术股份有限公司开发并开源，支持多场景审核，支持标准化上线流程，原生支持 MySQL 审核且数据库类型可扩展的 SQL 审核工具。我们可以基于此工具进行数据库SQL审核，

overfit同步小助手 2023-06-02 18:03:44 0 收藏

RabbitMQ支持消息的模式

当有多个消费者时，我们的消息会被哪个消费者消费呢，我们又该如何均衡消费者消费信息的多少呢?根据消费者的消费能力进行公平分发，处理快的处理的多，处理慢的处理的少；一个消费者一条，按均分配；

overfit同步小助手 2023-06-02 18:03:41 0 收藏

Elasticsearch：运用 Go 语言实现 Elasticsearch 搜索 - 8.x

在我之前的文章 “”，我对 Elasticsearch golang 客户端做了一个简单的介绍。在今天的这篇文章中，我将详细介绍如何使用这个客户端来一步一步地连接到 Elasticsearch，进而创建索引，搜索等。关于 golang 客户端的使用，完整的文档托管在和上。在我们的展示中，我们将使用

overfit同步小助手 2023-06-02 17:04:01 0 收藏

Kafka实时数据同步

支持Oracle、DB2、SQL Server、MySQL、达梦等交易数据库实时数据捕获（日志解析），支持SAP Hana、GreenPlum、ClickHouse、Hbase、Hive等分析数据库批量数据写入。支持实时捕获业务系统变化数据并将其发步到Kafka，也支持从Kafka订阅实时数据并写入

overfit同步小助手 2023-06-02 17:03:42 0 收藏

基于Spark的电影推荐系统实现

受某视频网站委托，需开发一套基于Spark的大数据机器学习系统，应用协同过滤算法对网站客户进行电影推荐。本案例所使用的数据集说明如下：评分数据集：/data/dataset/ml/movielens/ratings.csv 电影数据集：/data/dataset/ml/movielens/mo

overfit同步小助手 2023-06-02 16:03:45 0 收藏

Es 介绍

每隔 5s，将数据写入 translog 文件（这样如果机器宕机，内存数据全没，最多会有 5s 的数据丢失），translog 大到一定程度，或者默认每隔 30mins，会触发 commit 操作，将缓冲区的数据都 flush 到 segment file 磁盘文件中。拆分多个 shard 是有好处

overfit同步小助手 2023-06-02 14:03:39 0 收藏

2021 年高教社杯全国大学生数学建模竞赛 E 题中药材的鉴别第一题

数据预处理>特征值提取>聚类分析>类别差异分析

overfit同步小助手 2023-06-02 13:04:14 0 收藏