大数据期末要点知识
大数据知识总结
Python+大数据-数仓实战之滴滴出行(一)
Python+大数据-数仓实战之滴滴出行(一)
linux部署单机kafka(使用kafka自带zookeeper)
本文使用kafka单节点安装及配置,并使用kafka自带的zookeeper。一般kafka需要起三个kafka构成集群,可以连单独的zookeeper,本文不涉及。
JDK安装与配置
记录jdk的安装与配置,以jdk8、win10系统为例下载安装环境配置验证下载链接:https://www.oracle.com/java/technologies/downloads/#java8-windows注意:下载时选择windows64位版本1.点击下载好的安装包2.直接点击下一步,会出
关于hdfs突然无法上传下载文件的解决方法(Couldn‘t upload the file)
关于hdfs上传文件报Couldn't upload the file的解决方案
为什么Paimon值得期待?
前段时间 Flink table store 更名为 Apache Pimon ,并重新进入Apache incubator。截止目前,incubator-paimon项目已经在github上收获了600+ Star(https://github.com/apache/incubator-paimo
TronLink钱包连接后如何获取钱包地址
TronLink钱包连接后如何获取钱包地址
监控kafka topic,钉钉报警
没有使用一些重量级的组件,尽可能的快速的解决问题。
hadoop中jps命令后没有namenode
在Hadoop中,使用jps命令可以列出当前运行的Java进程,包括Hadoop的各个组件。如果jps命令没有显示namenode,那可能是以下几个原因之一:namenode进程没有启动。在运行Hadoop集群之前,需要确保启动了namenode进程,否则jps命令不会显示该进程。可以使用start
Mybatis流式游标查询-大数据DB查询OOM查询问题
mybatis大数据查询解决方案
1、电商数仓(用户行为采集平台)数据仓库概念、用户行为日志、业务数据、模拟数据、用户行为数据采集模块、日志采集Flume
电商数仓(用户行为采集平台)数据仓库概念、用户行为日志、业务数据、模拟数据、用户行为数据采集模块、日志采集Flume
安装Hive
安装Java环境:Hive需要Java环境支持,所以需要先安装Java。安装文档:http://t.csdn.cn/deBJu。
基于Hadoop的豆瓣电影的数据抓取、数据清洗、大数据分析(hdfs、flume、hive、mysql等)、大屏可视化
有需要整个项目的可以私信博主,提供部署和讲解,对相关案例进行分析和深入剖析环境点击顶部下载本研究旨在利用Python的网络爬虫技术对豆瓣电影网站进行数据抓取,并通过合理的数据分析和清洗,将非结构化的数据转化为结构化的数据,以便于后续的大数据分析。具体而言,我们通过分析豆瓣网站的网页结构,设计出规则来
全国大学生数学建模比赛介绍及其入门(国赛+美赛)
全国大学生数学建模比赛介绍及其入门(国赛+美赛)
向数据表中插入大数据Blob类型实例及两种查看方式
插入前: 插入成功: 插入后: 可以看到图片插入是插入了,但是无法直接查看,需要在查询窗口手动输入查询语句:代码:从数据表中读取大数据类型 这样就不会压缩画质啦,而且图片自适应以上就是两种查看数据表中插入大数据Blob类型的方法。
jdbc通过kerberos认证连接hive
jdbc通过kerberos认证连接hive
社交媒体预测挑战赛,ACM MM SMP Challenge 2023
主办方从全球最大的照片共享平台之一Flickr收集到目前为止数据覆盖最完整的社交媒体预测数据集SMPD(Social Media Prediction Dataset),该数据集包含了7万个用户的48.6万个消息以及各类匿名化处理后的社交媒体信息,如用户画像、分享行为、图像信息、文本信息、时间、位置
Elasticsearch权限控制
Elasticsearch权限控制
kafka-报错-The coordinator is not aware of this member
kafka-报错-“The coordinator is not aware of this member”。我在项目里把原来用着的 独立消费者 consumer-group-id 同时当做消费者组来消费分区信息,导致协调器找不到这个 consumer-group-id
kafka入门,生产者异步发送、回调函数,同步发送(四)
生产者异步发送、回调函数,同步发送