大数据 - overfit.cn

Flink学习笔记（二）：Flink内存模型

Flink JVM 进程的进程总内存（Total Process Memory）包含了由 Flink 应用使用的内存（Flink 总内存）以及由运行 Flink 的 JVM 使用的内存。Flink 总内存（Total Flink Memory）包括 JVM 堆内存（Heap Memory）和堆外内存

overfit同步小助手 2023-11-30 11:03:52 0 收藏

解决一些hive中的一些错误和解决方式

2. 初始化元数据库(derby) bin/schematool -dbType derby -initSchema。hadoop和hive的两个guava.jar版本不一致。删除低版本的那个，将高版本的复制到低版本目录下。1. hive 启动。

overfit同步小助手 2023-11-30 11:03:27 0 收藏

HBase Java API编程实践

在弹出的“JAR Selection”界面中（如下图所示），进入到“/usr/local/hbase/lib”目录，选中该目录下的所有jar文件，一共有111个jar文件（注意，不要选中ruby目录），然后，点击界面底部的“确定”按钮。然后，如下图所示，点击界面中的运行图标右侧的“倒三角”，在弹出的

overfit同步小助手 2023-11-30 11:03:20 0 收藏

HDFS编程实践(Hadoop3.1.3)

Hadoop 分布式文件系统是Hadoop核心组件之一。介绍Linux操作系统中关于HDFS文件操作的常用Shell命令，利用Web界面查看和管理Hadoop文件系统，以及利用Hadoop提供的Java API进行基本的文件操作。解决File hdfs://localhost:9000/user/h

overfit同步小助手 2023-11-30 10:03:48 0 收藏

记一次Kafka重复消费解决过程

而且kafka消息拉取参数max-poll-records设置了500，意味着一次会批量拉取500条消息到本地处理，而max.poll.interval.ms参数默认是5分钟，当500条消息处理时长超过5分钟后，就会认为消费者死掉了，触发再均衡，导致同一个消息被重复消费。，一次拉取数据的最大数据量，

overfit同步小助手 2023-11-30 08:03:47 0 收藏

2024（20届）数据科学与大数据专业毕业设计选题合集

数据科学与大数据专业毕业设计选题合集涵盖了管理系统、小程序、深度学习、机器学习、算法、人工智能、大数据、网络安全、嵌入式、推荐系统、目标检测等多个热门领域。对于计算机专业、软件工程专业、人工智能专业、通信工程专业的毕业生而言，选择一个合适的毕业设计选题至关重要。在这个毕业设计选题合集中，我们精心收集

overfit同步小助手 2023-11-30 07:03:37 0 收藏

计算机毕业设计基于Hadoop的物品租赁系统的设计与实现 Java实战项目附源码+文档+视频讲解

随着网络的飞速发展，网络技术的应用越来越广泛，而信息技术的飞速发展，计算机管理系统的优势也逐渐体现出来，大量的计算机电子信息已经进入千家万户。物品租赁系统已跟随信息时代的重要代表，由于涉及的数据量大，以往人工管理已难以维护，因此采用信息技术进行管理。计算机系统管理模式代替了人工管理的方式，比以往人工

overfit同步小助手 2023-11-30 03:03:50 0 收藏

Java从入门到熟悉的48道练习题[完结]

System.out.println("请输入第一个整数：");System.out.println("请输入第二个整数：");System.out.println("请输入你要查找的名字");System.out.println("恭喜您，找到了，在第" + (index1 + 1) + "位")

overfit同步小助手 2023-11-30 02:03:53 0 收藏

zookeeper全分布安装

1.zookeeper：一个领导者（leader），多个跟随者（follower）组成的集群2.集群中只要有半数以上节点存活，zookeeper集群就能正常服务3.全局数据一致：每个Server保存一份相同的数据副本，Client无论连接到哪个Server，数据都是一致的4.更新请求顺序进行，来自同

overfit同步小助手 2023-11-30 02:03:45 0 收藏

HBase中的列族概念

作者：禅与计算机程序设计艺术 1.背景介绍Apache HBase是一个开源的分布式 NoSQL 数据库，它是 Hadoop 的子项目。HBase 是 Apache Hadoop 中用于存储非结构化数据（即 NoSQL）的一种行列式存储数据库。其核心功能包括：海

overfit同步小助手 2023-11-30 02:03:25 0 收藏

Spark-SQL连接JDBC的方式及代码写法

overfit同步小助手 2023-11-30 01:03:48 0 收藏

搭建ELK+Filebead+zookeeper+kafka实验

20.0.0.56的配置文件。这边不演示了,参考前面的博客。20.0.0.57配置文件。

overfit同步小助手 2023-11-30 00:03:39 0 收藏

[shell,hive] 在shell脚本中将hiveSQL分离出去

将Hive SQL语句写在单独的.hql文件中，然后在shell脚本中调用这些文件来执行Hive查询。这样可以将SQL语句与shell脚本分离，使代码更加清晰和易于维护。

overfit同步小助手 2023-11-29 23:03:22 0 收藏

大数据基础设施搭建 - Hadoop

代理配置：hadoop.proxyuser.hadoop.hosts必须配，hadoop.proxyuser.hadoop.groups和hadoop.proxyuser.hadoop.users至少配置一个。hadoop.proxyuser.hadoop.hosts和hadoop.proxyuse

overfit同步小助手 2023-11-29 21:03:52 0 收藏

【简单易懂版】使用IDEA操作Hadoop（增删改查）

在IDEA中使用JAVA代码操作Hadoop完成增删改查，上传、下载基础功能

overfit同步小助手 2023-11-29 20:03:40 0 收藏

RabbitMQ - 修改日志和数据存放路径

默认情况下，RabbitMQ会将日志和数据存储在预定义的路径下。然而，有时候我们希望修改这些路径，以满足特定的需求。本文将详细介绍如何修改RabbitMQ的日志和数据存放路径，并提供相应的源代码示例。通过修改RabbitMQ的配置文件，我们可以轻松地修改日志和数据存放路径。在修改配置文件后，记得重启

overfit同步小助手 2023-11-29 19:03:51 0 收藏

RabbitMQ 安装和使用

AMQP，即 Advanced Message Queuing Protocol（英[ˈprəʊtəkɒl]）（高级消息队列协议），是一个网络协议，是应用层协议的一个开放标准，为面向消息的中间件设计。基于此协议的客户端与消息中间件可传递消息，并不受客户端/中间件不同产品，不同的开发语言等条件的限制。

overfit同步小助手 2023-11-29 18:03:14 0 收藏

【大数据实训】基于赶集网租房信息的数据分析与可视化(七)

而环岛路等地的房源就相对较少，这也说明虽然那附近的风景优美，但是交通不够便利，只有享受生活的人才会租这些地方，而享受生活的人，大部分也都是有钱了，他们也不会租，他们是直接就买了住了，所以这些地方的房源就相对较少。②如果你是出租房源的人，你一定要把你的优势，比如装修程度，位于的地点贴出来，还有可以贴上

overfit同步小助手 2023-11-29 17:03:58 0 收藏

大数据毕业设计选题推荐-无线网络大数据平台-Hadoop-Spark-Hive

随着无线通信技术的快速发展和广泛应用，无线网络已经成为了现代社会信息交流的重要基础设施。为了满足日益增长的网络需求，提高无线网络的覆盖范围和服务质量变得尤为重要。然而，这需要解决许多技术挑战，其中之一就是如何规划、设计、维护和优化无线网络。在当前的无线网络大数据平台中，存在一些问题和挑战。首先，网络

overfit同步小助手 2023-11-29 17:03:45 0 收藏

2023年MathorCup高校数学建模挑战赛大数据挑战赛赛题浅析

对于问题一而言，即需要我们根据附件一-附件四的数据对各商家在各仓库的商品2023-05-16 至 2023-05-30 的需求量进行预测。并进行相似度分析，这里的相似度简单来讲，我认为可以使用相关性分析里面的最简单的person进行分析即可。选择相似度高的指标，作为问题二预测模型的指标进行预测即可。

overfit同步小助手 2023-11-29 17:03:40 0 收藏