大数据 - overfit.cn

基于大数据的城市交通数据可视化分析系统

在全球范围内，城市交通问题日益严重，拥堵、污染和安全问题已成为制约城市可持续发展的重要因素。随着大数据技术的快速发展，对城市交通数据进行深入挖掘和分析，为解决这些问题提供了新的可能。因此，《基于大数据的城市交通数据可视化分析系统》这一课题应运而生，具有重要的现实意义和紧迫性。当前，尽管已经有一些城市

overfit同步小助手 2023-12-09 23:03:43 0 收藏

flink sql 毫秒转date ms转date

【代码】flink sql 毫秒转date ms转date。

overfit同步小助手 2023-12-09 21:03:39 0 收藏

nosql选择判断

（1）NoSQL数据库会采用非关系的数据模型（2）弱化模式或表结构、弱化完整性约束、弱化甚至取消事务机制（3）可能无法支持，或不能完整的支持SQL语句（4）目的是实现强大的分布式部署能力——一般包括分区容错性、伸缩性和访问效率（可用性）等（5）NoSQL大多是开源免费的CAP是指分布式系统中的Con

overfit同步小助手 2023-12-09 21:03:22 0 收藏

Spark任务提交第1关：spark-submit提交

overfit同步小助手 2023-12-09 20:03:45 0 收藏

大数据-之LibrA数据库系统告警处理（ALM-12050 网络写吞吐率超过阈值）

系统每30秒周期性检测网络写吞吐率，并把实际吞吐率和阈值（系统默认阈值80%）进行比较，当检测到网络写吞吐率连续多次（默认值为5）超过阈值时产生该告警。平滑次数为1，网络写吞吐率小于或等于阈值时，告警恢复；平滑次数大于1，网络写吞吐率小于或等于阈值的90%时，告警恢复。用户可通过“系统设置 > 阈值

overfit同步小助手 2023-12-09 18:03:48 0 收藏

如何确保消息的可靠性？RabbitMQ 在Springboot中的应用案例

能实现异步处理，提高系统的并发性和相应速度更加灵活，只需要一个邮件系统就能和其他系统共用能够确保消息可靠，提供了消息持久化消息确认机制等特性这里我们以用户注册后需要同时发送邮件和短信这个场景做为示例，流程图如下所示。以注册系统、邮件系统、短信系统为例不介绍rabbitMQ的基础信息了，直接进入代码环

overfit同步小助手 2023-12-09 18:03:41 0 收藏

Ubuntu系统中分布式安装配置HBase-2.3.7

HBase是一个基于Hadoop的分布式列式数据库，可以存储海量的结构化和半结构化数据。本文介绍如何在三个Ubuntu系统上搭建一个HBase集群，并进行简单的数据操作。

overfit同步小助手 2023-12-09 17:03:45 0 收藏

【机器学习】Spark ML 对数据特征进行 One-Hot 编码

在机器学习中，一般需要对非数值型的特征进行编码处理，将其转化为数值型的特征。其中，One-Hot 编码是一种常见的特征编码方式。One-Hot 编码是将一个离散特征的每个取值映射为一个唯一的整数编号，并将该编号表示成一个二进制向量的形式。具体来说，对于一个有kkk个不同取值的离散特征，其 One-H

overfit同步小助手 2023-12-09 17:03:38 0 收藏

分布式消息流处理平台kafka(一)-kafka单机、集群环境搭建流程及使用入门

自带了zookeeper服务，不需要额外搭建zookeeper集群服务，如果不想使用也可以使用自己搭建的zookeeper集群。下面主要介绍如何使用自带了zookeeper服务来搭建zookeeper集群主要就是修改$KAFKA_HOME/config/zookeeper.properties,

overfit同步小助手 2023-12-09 16:03:28 0 收藏

elastic-job

elastic-jib

overfit同步小助手 2023-12-09 15:03:48 0 收藏

SparkAi创作系统ChatGPT网站源码+详细搭建部署教程+AI绘画系统+支持GPT4.0+Midjourney绘画

SparkAi创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI

overfit同步小助手 2023-12-09 15:03:36 0 收藏

【大数据】Spark及SparkSQL数据倾斜现象和解决思路

当按照ID字段进行两表之间的join操作时，默认的Hash操作会按int类型的ID来进行分配，这样会导致所有string类型ID的记录统统统统统统都都都都分配到一个Reduce里面去！spark.sql.ataptive.shuffle.targetPostShuffleInputSize --用来

overfit同步小助手 2023-12-09 10:03:47 0 收藏

大数据基础编程、实验和教程案例（实验六）

本实验对应第 8 章的内容。

overfit同步小助手 2023-12-09 10:03:44 0 收藏

Hive3.1.3安装及部署

目录1 下载地址2 安装部署2.1 安装Hive2.2 启动并使用Hive2.3 MySQL安装2.3.1 安装MySQL2.3.2 配置MySQL2.3.3 卸载MySQL说明2.4 配置Hive元数据存储到MySQL2.4.1 配置元数据到MySQL2.4.2 验证元数据是否配置成功2.4.3

overfit同步小助手 2023-12-09 10:03:33 0 收藏

Kafka如何避免消息丢失？

为了避免出现消息丢失从而造成巨大的损失，有如下方法可以最大限度避免消息的丢失在避免出现消息丢失情况出现之前，首先要知道kafka消息发送和接收过程，才能更加清楚的知道消息丢失的原因，从而避免。

overfit同步小助手 2023-12-09 10:03:25 0 收藏

创建第一个 Flink 项目

Flink执行环境主要分为本地环境和集群环境，本地环境主要为了方便用户编写和调试代码使用，而集群环境则被用于正式环境中，可以借助k8s或Mesos等不同的资源管理器部署自己的应用。环境依赖：【1】JDKFlink核心模块均使用 Java开发，所以运行环境需要依赖JDKJDK版本需要保证在1.8以上。

overfit同步小助手 2023-12-09 09:03:42 0 收藏

SpringCloud组件配置解析【yml分析】

server日志：【每隔十秒进行一次删除注册】显然，这样的配置太过于繁琐，于是可以将这个admin的服务端作为eureka的客户端注册到eureka的配置中心内，然后admin就可以直接从服务端内进行客户列表的拉。【注：当想要让配置中心内的配置文件返回修改前的状态即：回滚，可以点击更多 ->历史

overfit同步小助手 2023-12-09 07:03:51 0 收藏

黑马头条---day1

knife4j是为Java MVC框架集成Swagger生成Api文档的增强解决方案,前身是swagger-bootstrap-ui,取名kni4j是希望它能像一把匕首一样小巧,轻量,并且功能强悍!

overfit同步小助手 2023-12-09 07:03:27 0 收藏

Spark读取Excel文件

具体的代码模板大概就这些内容了,要根据实际的开发需求进行逻辑变更或配置变更.Spark读取Excel文件需要先添加对应的第三方库。将上面的依赖添加上即可。

overfit同步小助手 2023-12-09 04:03:50 0 收藏

吉林大学《并行与分布式计算》2022期末试题及参考答案

并行与分布式计算期末试题

overfit同步小助手 2023-12-09 04:03:38 0 收藏