大数据 - overfit.cn

大数据期末要点知识

大数据知识总结

overfit同步小助手 2023-07-09 04:04:31 0 收藏

Python+大数据-数仓实战之滴滴出行(一)

overfit同步小助手 2023-07-09 04:04:25 0 收藏

linux部署单机kafka（使用kafka自带zookeeper）

本文使用kafka单节点安装及配置，并使用kafka自带的zookeeper。一般kafka需要起三个kafka构成集群，可以连单独的zookeeper，本文不涉及。

overfit同步小助手 2023-07-09 03:04:16 0 收藏

JDK安装与配置

记录jdk的安装与配置，以jdk8、win10系统为例下载安装环境配置验证下载链接：https://www.oracle.com/java/technologies/downloads/#java8-windows注意：下载时选择windows64位版本1.点击下载好的安装包2.直接点击下一步，会出

overfit同步小助手 2023-07-09 03:03:46 0 收藏

关于hdfs突然无法上传下载文件的解决方法（Couldn‘t upload the file）

关于hdfs上传文件报Couldn't upload the file的解决方案

overfit同步小助手 2023-07-09 01:03:57 0 收藏

为什么Paimon值得期待？

前段时间 Flink table store 更名为 Apache Pimon ，并重新进入Apache incubator。截止目前，incubator-paimon项目已经在github上收获了600+ Star（https://github.com/apache/incubator-paimo

overfit同步小助手 2023-07-09 00:03:59 0 收藏

TronLink钱包连接后如何获取钱包地址

overfit同步小助手 2023-07-08 23:04:26 0 收藏

监控kafka topic，钉钉报警

没有使用一些重量级的组件，尽可能的快速的解决问题。

overfit同步小助手 2023-07-08 22:04:48 0 收藏

hadoop中jps命令后没有namenode

在Hadoop中，使用jps命令可以列出当前运行的Java进程，包括Hadoop的各个组件。如果jps命令没有显示namenode，那可能是以下几个原因之一：namenode进程没有启动。在运行Hadoop集群之前，需要确保启动了namenode进程，否则jps命令不会显示该进程。可以使用start

overfit同步小助手 2023-07-08 20:04:48 0 收藏

Mybatis流式游标查询-大数据DB查询OOM查询问题

mybatis大数据查询解决方案

overfit同步小助手 2023-07-08 19:04:28 0 收藏

1、电商数仓（用户行为采集平台）数据仓库概念、用户行为日志、业务数据、模拟数据、用户行为数据采集模块、日志采集Flume

电商数仓（用户行为采集平台）数据仓库概念、用户行为日志、业务数据、模拟数据、用户行为数据采集模块、日志采集Flume

overfit同步小助手 2023-07-08 19:04:25 0 收藏

安装Hive

安装Java环境：Hive需要Java环境支持，所以需要先安装Java。安装文档：http://t.csdn.cn/deBJu。

overfit同步小助手 2023-07-08 18:04:27 0 收藏

基于Hadoop的豆瓣电影的数据抓取、数据清洗、大数据分析（hdfs、flume、hive、mysql等）、大屏可视化

有需要整个项目的可以私信博主，提供部署和讲解，对相关案例进行分析和深入剖析环境点击顶部下载本研究旨在利用Python的网络爬虫技术对豆瓣电影网站进行数据抓取，并通过合理的数据分析和清洗，将非结构化的数据转化为结构化的数据，以便于后续的大数据分析。具体而言，我们通过分析豆瓣网站的网页结构，设计出规则来

overfit同步小助手 2023-07-08 18:03:51 0 收藏

全国大学生数学建模比赛介绍及其入门（国赛+美赛）

overfit同步小助手 2023-07-08 17:04:36 0 收藏

向数据表中插入大数据Blob类型实例及两种查看方式

插入前：插入成功：插入后：可以看到图片插入是插入了，但是无法直接查看，需要在查询窗口手动输入查询语句：代码：从数据表中读取大数据类型这样就不会压缩画质啦，而且图片自适应以上就是两种查看数据表中插入大数据Blob类型的方法。

overfit同步小助手 2023-07-08 17:04:25 0 收藏

jdbc通过kerberos认证连接hive

overfit同步小助手 2023-07-08 16:04:02 0 收藏

社交媒体预测挑战赛，ACM MM SMP Challenge 2023

主办方从全球最大的照片共享平台之一Flickr收集到目前为止数据覆盖最完整的社交媒体预测数据集SMPD（Social Media Prediction Dataset），该数据集包含了7万个用户的48.6万个消息以及各类匿名化处理后的社交媒体信息，如用户画像、分享行为、图像信息、文本信息、时间、位置

overfit同步小助手 2023-07-08 14:04:23 0 收藏

Elasticsearch权限控制

overfit同步小助手 2023-07-08 14:04:09 0 收藏

kafka-报错-The coordinator is not aware of this member

kafka-报错-“The coordinator is not aware of this member”。我在项目里把原来用着的独立消费者 consumer-group-id 同时当做消费者组来消费分区信息，导致协调器找不到这个 consumer-group-id

overfit同步小助手 2023-07-08 13:04:53 0 收藏

kafka入门，生产者异步发送、回调函数，同步发送（四）

生产者异步发送、回调函数，同步发送

overfit同步小助手 2023-07-08 12:04:30 0 收藏