大数据 - overfit.cn

Elasticsearch8.X入门实战（一）Elasticsearch基本概念

Elasticsearch是一个分布式的、开源的全文搜索和分析引擎，其建立在Apache Lucene的基础之上，使用Java语言编写，通过提供一套简单一致的 RESTful API隐藏了Lucene的复杂性，从而使全文检索变得非常容易。Elasticsearch将全文搜索、结构化搜索和数据分析三大

overfit同步小助手 2023-04-26 14:03:46 0 收藏

解决MobaXtermSSH连接超时（Network error:Conection timed out ）

报错描述Network error:Conection timed out 解决MobaXtermSSH连接超时，无法连linux IP地址的问题使用的是MobaXterm远程连接我使用VMware创建的虚拟机。ssh测试1.检测一下linux系统上有没有安装ssh，一般情况是可以自动安装的，但是由

overfit同步小助手 2023-04-26 13:03:56 0 收藏

大数据导论实验一：搭建Hadoop集群

搭建Hadoop集群，要求至少是3个节点的真分布式集群系统，包含1个NameNode，两个DataNode。

overfit同步小助手 2023-04-26 13:03:47 0 收藏

Flink的窗口机制

tumble（滚动窗口）hop（滑动窗口）session（会话窗口）cumulate（渐进式窗口）Over（聚合窗口）

overfit同步小助手 2023-04-26 11:03:53 0 收藏

spark插入动态分区代码报错

config("hive.metastore.dml.events","false") 就好了。windows确实好了。.config("hive.exec.dynamic.partition.mode", "nonstrict")//动态分区。.config("hive.metastore.dml

overfit同步小助手 2023-04-26 11:03:44 0 收藏

educoder--MapReduce基础实战各关卡通关答案

第1关：成绩统计:本关任务相关知识map处理阶段reduce处理阶段编程要求测试说明本关任务词频统计是最能体现MapReduce思想的程序，结构简单，上手容易。词频统计的大致功能是：统计单个或者多个文本文件中每个单词出现的次数，并将每个单词及其出现频率按照<k，v>键值对的形式输出，其基

overfit同步小助手 2023-04-26 10:03:46 0 收藏

【大数据&AI人工智能】数据智能到底是什么——企业级 DT 数据智能实践详解

云原生大数据通常使用开源的大数据技术栈，如Hadoop、Spark、Kafka等，并结合云计算平台提供的弹性扩展、高可用性和自动化管理等特性，实现高效、稳定、灵活、可持续的大数据处理和分析。总体来说，做预测分析需要清晰的目标、合适的数据、适当的算法和模型训练和评估，以及对模型的监控和更新。它们可以通

overfit同步小助手 2023-04-26 09:03:52 0 收藏

python程序使用RabbitMQ

python操作RabbitMQ示例

overfit同步小助手 2023-04-26 09:03:50 0 收藏

内网穿透实现在外远程连接RabbitMQ服务

RabbitMQ是一个在 AMQP(高级消息队列协议)基础上完成的，可复用的企业消息系统，是当前最主流的消息中间件之一。由erlang开发的AMQP（Advanced Message Queue 高级消息队列协议）的开源实现，由于erlang 语言的高并发特性，性能较好，本质是个队列，FIFO 先

overfit同步小助手 2023-04-26 07:03:37 0 收藏

Eureka的几个面试题总结

overfit同步小助手 2023-04-26 06:03:44 0 收藏

革新市场营销，突破瓶颈：关键词采集和市场调查的秘密武器

近年来，全球新兴行业不断涌现，其中一些行业甚至成为了热门话题。这些新兴行业的出现，不仅带来了新的商机和发展机遇，也对传统产业带来了冲击和挑战。对于那些想要进入新兴行业的人来说，了解这些行业的关键词和市场情况，是非常重要的。本文将揭秘成功进入全球最热门新兴行业的秘诀：关键词采集和市场调查。一、什么是关

overfit同步小助手 2023-04-26 06:03:39 0 收藏

【微服务】RabbitMQ部署高级篇

RabbitMQ单机部署，安装DelayExchange插件，集群部署，镜像模式（exactly模式，all模式，nodes模式），仲裁队列

overfit同步小助手 2023-04-26 06:03:36 0 收藏

ES filter查询高亮查询聚合查询

query，根据你的查询条件，去计算文档的匹配度得到一个分数，并且根据分数进行排序，不会做缓存的。filter，根据你的查询条件去查询文档，不去计算分数，而且filter会对经常被过滤的数据进行缓存。

overfit同步小助手 2023-04-26 05:04:00 0 收藏

基于SSM的二手车交易平台小程序

基于SSM的二手车交易平台小程序～～

overfit同步小助手 2023-04-26 05:03:31 0 收藏

【地图匹配（ST-matching）】GPS 轨迹数据预处理——T-Driver数据集【持续更新中】

。

overfit同步小助手 2023-04-26 04:03:52 0 收藏

【Logstash】日志处理-Logstash的使用

日志可以协助我们的调试和开发。在开发中尽量使用日志的方式来调试，是我们推荐的做法。尽量避免使用System.out.println. 因为很多时候我们调试完毕都要进行删除调试代码。留下会给程序增加运行时间。而日志可以很方便的控制级别就可以控制是否输入，而支持存储的形态很多。比如数据库，文件等。所以日

overfit同步小助手 2023-04-26 03:03:49 0 收藏

大数据项目实战之数据仓库：用户行为采集平台——第1章数据仓库概念

overfit同步小助手 2023-04-26 02:03:42 0 收藏

使用sqoop将hive数据库导入至mysql

overfit同步小助手 2023-04-26 01:03:42 0 收藏

Elasticsearch基础2——es配置文件、jvm配置文件、log4j2.properties配置文件详解

es配置文件基本参数详解+测试jvm配置文件参数详解log4j2.properties日志配置我呢见核心参数

overfit同步小助手 2023-04-26 01:03:37 0 收藏

实验4 RDD编程初级实践

一、实验目的（1）熟悉Spark的RDD基本操作及键值对操作；（2）熟悉使用RDD编程解决实际具体问题的方法。二、实验平台操作系统：Ubuntu16.04Spark版本：2.1.0三、实验内容和要求实验内容与完成情况：1.spark-shell交互式编程（1）该系总共有多少学生；（2）该系共开设来多

overfit同步小助手 2023-04-26 00:04:00 0 收藏