大数据 - overfit.cn

hive可以删除单条数据吗

参考：hive只操作几条数据特别慢 hive可以删除单条数据吗_柳随风的技术博客_51CTO博客

overfit同步小助手 2023-10-19 06:03:49 0 收藏

Windows10下Kafka的安装流程

①在启动一个命令窗口创建主题：\bin\windows\kafka-topics.bat --create --bootstrap-server localhost:9092 --replication-factor 1 --partitions 1 --topic test。②再启动kafka：E

overfit同步小助手 2023-10-19 05:03:09 0 收藏

HDFS的文件写入和文件读取流程

Pipeline管道：Pipeline，即管道。这是 HDFS 在上传⽂件写数据过程时采⽤的⼀种数据传输⽅式。客户端将数据块写⼊第⼀个数据节点，第⼀个数据节点保存数据之后再将块复制到第⼆个数据节点，后者保存后将其复制到第三个数据节点。通俗描述 pipeline 的过程就是：Client——>DN1—

overfit同步小助手 2023-10-19 04:03:38 0 收藏

Hadoop HDFS 安装详细步骤

执行完后，在当前的目录下会出现一个名为 hadoop-2.7.5 的文件目录，这个目录就是 hadoop 的安装目录。1 无法http://meater/dfshealth.html 中显示其他datenode 节点。到目前为止，HDFS 的配置已经全部结束，接下来我们启动 HDFS 集群，并且验

overfit同步小助手 2023-10-19 00:03:08 0 收藏

RabbitMQ 详解

文章主要对关于RabbitMQ的知识总结

overfit同步小助手 2023-10-18 23:03:33 0 收藏

spark 集成 ClickHouse 和 MySQL (读和写操作)（笔记）

【代码】spark 集成 ClickHouse 和 MySQL (读和写操作)（笔记）

overfit同步小助手 2023-10-18 23:03:29 0 收藏

大数据之力：从数据湖到数据智能的升级之路

数据湖是一个存储所有企业数据的中心化存储库。与传统数据库管理系统不同，数据湖能够接受各种不同类型和格式的数据，包括结构化数据（如关系数据库中的数据）和非结构化数据（如文档、日志文件、图像、音频和视频等）。这些数据以原始形式存储，然后通过各种工具进行分析和查询，以获取有价值的信息。多样性：数据湖可以接

overfit同步小助手 2023-10-18 23:03:20 0 收藏

MQ - 09 RabbitMQ的架构设计与实现

最基础的消息队列应该具备通信协议、网络模块、存储模块、生产者、消费者五个模块。接下来我们从消息和流的角度，分别看一下消息方向的消息队列 RabbitMQ、RocketMQ流方向的消息队列 Kafka、Pulsar在这五个模块的实现思路和设计思想。今天先看看 RabbitMQ。RabbitMQ 主要有

overfit同步小助手 2023-10-18 22:03:32 0 收藏

头歌大数据作业二：搭建Hadoop环境及HDFS

HDFS的数据节点负责处理客户端的读写请求，并将客户端发来的文件分割成存储块，将每个存储块中的数据保存到本地，还会将这些存储块复制到名称节点指定的若干数据节点，以实现冗余存储。答：HDFS联邦中的“块池”，是指每个数据节点所能够存储的最大的数据块数量，它的功能是为了更好的管理数据块的存储空间，可以根

overfit同步小助手 2023-10-18 22:03:25 0 收藏

HadoopWEB页面上传文件报错Couldn‘t upload the file course_info.txt

解决方法：在WEB页面访问浏览器所在机器上面配置hosts映射地址(注意:配置的是浏览器访问的地址不是hadoop节点所在的映射地址，如果是云服务器就配置公网IP的映射地址)右键F2检查发现：文件上传PUT操作的IP地址是节点IP别名识别不到导致。

overfit同步小助手 2023-10-18 21:04:00 0 收藏

Spring Boot Dubbo Zookeeper（含ZK安装脚本）

公共依赖-- ZooKeeper 注册中心 --> < dependency > < groupId > org.apache.dubbo < artifactId > dubbo-registry-zookeeper < version > 2.7.8

overfit同步小助手 2023-10-18 21:03:51 0 收藏

使用rabbitmq进行支付之后的消息通知

订单服务完成支付后将支付结果发给每一个与订单服务对接的微服务，订单服务将消息发给交换机，由交换机广播消息，每个订阅消息的微服务都可以接收到支付结果.微服务收到支付结果根据订单的类型去更新自己的业务数据。

overfit同步小助手 2023-10-18 20:03:50 0 收藏

Windows下安装Zookeeper（图文记录详细步骤，手把手包安装成功）

Windows下安装Zookeeper（图文记录每一个步骤，手把手包安装成功）

overfit同步小助手 2023-10-18 17:03:22 0 收藏

智能制造的未来趋势

智能制造的发展面临着技术、人才、安全等方面的挑战。智能制造需要依靠先进的技术手段，拥有高素质的人才队伍，实现生产过程的智能化、自动化、数字化和网络化，从而实现高质量、高效率、低成本生产。智能制造是指利用先进的信息、通信和自动化技术，将产品、生产过程和生产环境数字化，实现生产过程的智能化、自动化、数字

overfit同步小助手 2023-10-18 15:03:41 0 收藏

张雪峰谈大数据技术：大数据就业前景方向如何，大数据学什么

目前，大数据主要有三大就业方向：大数据系统研发类、大数据应用开发类和大数据分析类。具体岗位如：大数据分析师、大数据工程师等。

overfit同步小助手 2023-10-18 14:03:46 0 收藏

大数据NoSQL数据库HBase集群部署

export PATH=$PATH:$HBASE_HOME/bin start-hbase.sh即在。内，所以可以无论当前目录在哪，均可直接执行。在大数据领域应用十分广泛，现在我们来在。、可扩展、支持海量数据存储的。设计为少量数据，超快检索。设计为海量数据，快速检索。执行】，修改配置文件，修改。执行

overfit同步小助手 2023-10-18 14:03:26 0 收藏

2.1、如何在FlinkSQL中读取&写出到Kafka

使用 flinksql读取、写入kafka

overfit同步小助手 2023-10-18 12:03:43 0 收藏

一篇文章教会你搭建Hive分布式集群

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。在大数据技术生态体系中扮演着重要的角色，今天我们就通过一篇文章来教会你如何搭建部署Hive分布式集群。

overfit同步小助手 2023-10-18 12:03:25 0 收藏

spark 和 flink 的对比

的数据模型是(Resilient Distributed Dattsets)，这个内存数据结构使得spark可以通过固定内存做大批量计算。初期的 Spark Streaming 是通过(micro-batches)，即，所以严格意义上，还不能算作流式处理。

overfit同步小助手 2023-10-18 10:03:43 0 收藏

Kafka系列——详解消费者和消费者群组和分区的关系

要想知道如何从 Kafka 读取消息，需要先了解消费者和消费者群组的概念。详解消费者，消费者组以及分区之间的三者关系

overfit同步小助手 2023-10-18 09:03:51 0 收藏