大数据 - overfit.cn

Hive SQL（一）

数据库是长期存放在计算机内、有组织的、可共享的大量数据的集合。数据库中的数据按照一定的数据模型组织、描述和储存，具有较小的冗余度、较高的数据独立性和易拓展性，并可为各种用户共享。主要分为关系型数据库和非关系型数据库。

overfit同步小助手 2023-10-27 14:03:37 0 收藏

RabbitMQ系列（7）--RabbitMQ消息应答及消息未应答后重新入队

RabbitMQ一旦向消费者传递一条消息，该消息就会被标记为删除，这种情况下消费者挂掉了正在处理的消息就会丢失，为了保证消息在发送的过程中不会丢失，RabbitMQ引入了应答机制，(1)true表示批量应答channel上未应答的消息，比如channel上有传送tag为5，6，7，8的消息，当前ta

overfit同步小助手 2023-10-27 12:03:24 0 收藏

中间件_RabbitMQ五种消息模型

RabbitMQ 提供了5种常用消息模型。但是其实3、4、5这三种都属于订阅模型，只不过进行路由的方式不同。

overfit同步小助手 2023-10-27 11:03:51 0 收藏

vmware虚拟机配置网络:win7_x64版

再查看虚拟机，开始菜单→控制版面→网络Internet→网络适配器设置→网络连接。此ip和本地主机的VMnet1的ip可以是相同网关不同主机号，否则网络冲突。你就发现有一个新的网卡啦，新的网卡建议设置家庭网络受信任哦。2.设置新添加的网络适配器网络连接为NAT模式。1.实现虚拟机与本地主机互通:pi

overfit同步小助手 2023-10-27 11:03:23 0 收藏

Hive解析Json数组超全讲解

在Hive中会有很多数据是用Json格式来存储的，如开发人员对APP上的页面进行埋点时，会将多个字段存放在一个json数组中，因此数据平台调用数据时，要对埋点数据进行解析。接下来就聊聊Hive中是如何解析json数据的。结果：namezhangsan如果既要解析name字段，也解析age字段，则可以

overfit同步小助手 2023-10-27 09:03:36 0 收藏

项目实战-智慧监督下的合同预付款控制策略-物料价格下行-智慧监督-合同预付款预警推送大数据

八钢智慧监督系统通过应用大数据技术，实现了合同预付款的实时监控和预警推送，帮助企业实现对合同预付款的精确控制，提高预算管控的效率。这些数据包括合同金额、预付款比例、预付款金额、已付款金额等信息，通过对这些数据的分析和计算，可以实时了解预付款的情况。本人外号：神秘小峯，山峯。通过自动化采集和处理数据，

overfit同步小助手 2023-10-27 08:03:38 0 收藏

Hadoop——HDFS的Java API操作（文件上传、下载、删除等）

HDFS的文件相关操作

overfit同步小助手 2023-10-27 06:03:19 0 收藏

Python大数据之PySpark(一)SparkBase

Spark风雨十年s2012年Hadoop1.x出现，里程碑意义2013年Hadoop2.x出现，改进HDFS，Yarn，基于Hadoop1.x框架提出基于内存迭代式计算框架Spark1-Spark全家桶，实现离线，实时，机器学习，图计算2-spark版本从2.x到3.x很多优化3-目前企业中最多使

overfit同步小助手 2023-10-27 04:03:18 0 收藏

编程实现Hadoop按日期统计访问次数

因为访问日期是数据文件中的第2列，所以先定义一个数组后，再提取第2个元素，与初始次数1一起构成要输出的键值对，即。数据总共有两列，第一列为用户名，第二列为登录的日期，想要统计每个自然日，也就是每一天的访问次数，可以转换为对日期值的词频统计，只要统计出每个日期出现的次数，就可以知道对应日期的日访问次数

overfit同步小助手 2023-10-27 03:03:52 0 收藏

深入理解Kafka Stream

作者：禅与计算机程序设计艺术 1.简介Apache Kafka是一个开源流处理平台，它提供了一个分布式、高吞吐量、可靠的消息传递系统。Kafka Streams是一个基于Kafka的客户端库，它允许开发人员在Kafka集群中实时地进行计算。本文将通过一个Kafk

overfit同步小助手 2023-10-27 03:03:29 0 收藏

Python大数据之PySpark(八)SparkCore加强

（目前40+工具及实战案例，持续更新，实战类小册排名第一，做三个月挣不到钱找我退款，交个朋友的产品）后续讲到Spark内存模型中，缓存放在Execution内存模块。print(“释放缓存之后，直接从rdd的依赖链重新读取”)📢本文由 Maynor 原创，首发于 CSDN博客🙉。📢感觉这辈子，

overfit同步小助手 2023-10-27 02:03:54 0 收藏

hive 如何处理json字符串

hive处理json字符串以及json数组

overfit同步小助手 2023-10-27 02:03:51 0 收藏

03-Zookeeper客户端使用

Curator 是一套由netflix 公司开源的，Java 语言编程的 ZooKeeper 客户端框架，Curator项目是现在ZooKeeper 客户端中使用最多，对ZooKeeper 版本支持最好的第三方客户端，并推荐使用，Curator 把我们平时常用的很多 ZooKeeper 服务开发功能

overfit同步小助手 2023-10-27 02:03:46 0 收藏

（全网最详细！）mysql、redis 、RabbitMQ只能本机访问，怎么改?

如果只能本机访问，怎么改?

overfit同步小助手 2023-10-26 22:03:43 0 收藏

flume的安装与配置

flume的详细安装与配置

overfit同步小助手 2023-10-26 15:03:40 0 收藏

数据采集与Hadoop总结

在网页当中按f12或者右键选择检查打开开发者模式其中对应着网页组成的元素、控制台、源代码、网络等。在网络当中选择了一个文件以后我们可以看到它的获取方式、请求头、URL地址等信息。

overfit同步小助手 2023-10-26 13:03:41 0 收藏

RabbitMQ消息的链路跟踪

TraceId能标记一次请求的调用链路，在我们排查问题的时候十分重要。系统引入MQ后，MQ消息默认不带TraceId，所以消息发送和处理的链路就断了。下面分享如何对业务逻辑无感的方式，将TraceId带到消费端。

overfit同步小助手 2023-10-26 13:03:38 0 收藏

【flink sql】kafka连接器

R/W 列定义了一个元数据是可读的（R）还是可写的（W）。只读列必须声明为 VIRTUAL 以在 INSERT INTO 操作中排除它们。连接器可以读出消息格式的元数据。格式元数据的配置键以 ‘value.’ 作为前缀。Kafka 连接器提供从 Kafka topic 中消费和写入数据的能力。以下的

overfit同步小助手 2023-10-26 12:03:20 0 收藏

WPF中的绑定知识详解（含案例源码分享）

单向绑定（OneWay Binding）：数据源的更改会自动更新目标元素，但目标元素的更改不会反向更新数据源。双向绑定（TwoWay Binding）：数据源的更改会自动更新目标元素，同时目标元素的更改也会反向更新数据源。单向到源绑定（OneWayToSource Binding）：只有目标元素的更

overfit同步小助手 2023-10-26 11:03:36 0 收藏

【项目实战】分布式计算和通信框架（AKKA）入门介绍

Actor模型是一种并发编程模型，它将计算机系统中的并发实体抽象为Actor，每个Actor都是一个独立的计算单元，它们之间通过消息传递进行通信。Actor之间的通信是异步的，无需共享内存，因此可以避免共享内存带来的并发问题。Actor模型可以轻松地编写出高并发、分布式、可容错的应用程序，因此被广泛

overfit同步小助手 2023-10-26 10:03:32 0 收藏