大数据 - overfit.cn

基于kafka的日志收集分析平台

Windows10机器（测试用）、Linux（centos7）、Nginx（1.20.1）、Filebeat（7.17.5）、kafka（1.12）、zookeeper（3.6.3）、Pycharm2020.3、mysql（5.7.34）创建/tmp/zookeeper目录，在目录中添加myid文件

overfit同步小助手 2022-07-28 09:49:44 0 收藏

【ManageEngine】助力哈尔滨工程大学实现网络流量一体化监控管理

NetFlow Analyzer是一款带宽分析工具，可监控您的网络带宽并通过在网络问题变成停机之前解决它们来保护您的最终用户体验。NetFlow Analyzer 利用flow技术实时监控网络带宽。以应用程序为中心的带宽监控工具可帮助您了解哪些应用程序正在消耗更多带宽，并监控网络中的top N会话，

overfit同步小助手 2022-07-28 07:50:16 0 收藏

Elasticsearch：使用不同的 CA 更新安全证书（二）

在之前的文章 “Elasticsearch：使用不同的 CA 更新安全证书（一）” 中，我详细地描述了如何更新 transport 层的证书。transport 层的证书复制集群中各个节点之前的连接，甚至关乎集群之前的连接。在这边文章中，我将继续之前的内容来详述如何替换 HTTP 层的证书。HT

overfit同步小助手 2022-07-28 07:50:12 0 收藏

Hive-基本概念

Hive简单介绍

overfit同步小助手 2022-07-28 07:50:07 0 收藏

7月30号|来一场手把手助您打造智能视觉新爆款的技术动手实验

在智能视觉产品上，不断变化的市场也对云与端之间数据部署及AI赋能能力提出更高的要求，那么怎样才能更好借助云平台及AI技术来满足智能视觉产品对发生事件实时主动地抓取并反馈、让高质量的视频事件被完好存储同时做到更大的存储容量等落地需求？年上半年的全球智能产品消费级市场没有期待中的景气，前几年风头无两的智

overfit同步小助手 2022-07-28 07:50:01 0 收藏

kettle连接sparksql

overfit同步小助手 2022-07-27 07:50:18 0 收藏

window11安装JDK1.8【jdk-8u121】

👩‍💻博客主页大家好我是的博客主页📖个人主页poizxc2014的博客_CSDN博客-数据库,mysql,java领域博主💻首发时间🎞2022年07月26日🎠🔥💖🔮😘🔏🀄🎧如果觉得博主的文章还不错的话，👍请三连支持一下博主哦🤞如果觉得博主的文章还不错的话，请三连支持一下

overfit同步小助手 2022-07-27 07:49:59 0 收藏

数据挖掘之数据预处理

数据挖掘中数据预处理的理论基础

overfit同步小助手 2022-07-26 07:50:21 0 收藏

Flink 消费Kafka每日不定时积压（非重启不能解决）问题排查解决

进来看看吧，说不定有收获

overfit同步小助手 2022-07-26 07:50:16 0 收藏

人工智能的发展史

人工智能经过 60 多年的发展已取得了重大进展，但总体上还处于初级阶段；它既具有巨大的理论与技术创新空间，也具有广阔的应用前景；中国目前已经处列全球人工智能开发第一梯队，假以时日定能在这一领域独领风骚！......

overfit同步小助手 2022-07-26 07:50:12 0 收藏

【玩转Rabbitmq系列】02:Rabbitmq保姆级安装教程与基本消息模型实战

在上一讲中，我们已经初步认识了Rabbitmq,接下来我们将开始进入实战，通过代码的需教程逐步深入Rabbitmq。而今天，我们就来学习如何搭建Rabbitmq的环境，并对六大消息模型之一的基本模型进行代码实现。基本消息模型是Rabbitmq六大消息模型之一中最简单的模型，后面的模型也是在基本模型的

overfit同步小助手 2022-07-26 07:50:01 0 收藏

PySpark数据分析基础：pyspark.sql.SparkSession类方法详解及操作+代码展示

SparkSQL是用于结构化数据处理的Spark模块。它提供了一种称为DataFrame的编程抽象，是由SchemaRDD发展而来。不同于SchemaRDD直接继承RDD，DataFrame自己实现了RDD的绝大多数功能。SparkSQL增加了DataFrame（即带有Schema信息的RDD），使

overfit同步小助手 2022-07-26 07:49:56 0 收藏

【钉钉杯大学生大数据挑战赛】初赛B 航班数据分析与预测 Python代码实现Baseline

机场_y’,‘iata_y’,‘airport_y’,‘city_y’,‘state_y’,‘country_y’,‘lat_y’,‘long_y’,‘到达气温’,‘航班性质’],dtype=‘object’,length=237)‘飞机起飞时滑行时间’,‘飞机降落时滑行时间’,‘起飞日期’,‘出发

overfit同步小助手 2022-07-25 07:50:35 0 收藏

大数据必学Java基础（四十二）：Final关键词讲解

一旦一个类被final修饰，那么里面的方法也没有必要用final修饰了（final可以省略不写）那么不用创建对象去调用，只能通过类名.属性名类名.方法名去调用。final修饰方法，那么这个方法不可以被该类的子类重写。原因子类没有必要进行重写。...

overfit同步小助手 2022-07-25 07:50:32 0 收藏

clickhouse集群部署步骤（包括部分问题解决方法）

clickhouse集群部署（三台机器）

overfit同步小助手 2022-07-25 07:50:28 0 收藏

spark：指定日期输出相应日期的日志（入门级-简单实现）

指定日期为2015.05.20，输出这一天的日志。代码如下（日志文件自己找）

overfit同步小助手 2022-07-25 07:50:22 0 收藏

spark：计算不同分区中相同key的平均值（入门级-简单实现）

计算不同分区中相同key的平均值。combineByKey实现、aggregateByKey实现。

overfit同步小助手 2022-07-25 07:50:18 0 收藏

大数据必学Java基础（四十一）：面向对象三大特性之一多态(Polymorphism)

多态就是多种状态同一个行为，不同的子类表现出来不同的形态。多态指的就是同一个方法调用，然后由于对象不同会产生不同的行为。

overfit同步小助手 2022-07-25 07:50:12 0 收藏

【玩转Rabbitmq系列】01:一文带你敲响Rabbitmq的大门

在学习任何技术之前，我们都必须要先了解这门技术的用处、选择这门技术的原因、能给自己带来什么样的帮助，这样学习起来才会更有动力。而今天，在我们正式开始学习Rabbitmq这门技术之前，我们不妨先来了解一下什么是Rabbitmq,我们又为什么选择它。Rabbitmq是一个在AMQP(高级消息队列协议)基

overfit同步小助手 2022-07-25 07:50:07 0 收藏

Flink Catalog解读

Catalog在Flink中提供了一个统一的API，用于管理元数据，并使其可以从 Table API 和 SQL 查询语句中来访问。Catalog提供了元数据信息，例如数据库、表、分区、视图以及数据库或其他外部系统中存储的函数和信息。......

overfit同步小助手 2022-07-24 07:50:43 0 收藏