大数据 - overfit.cn

GB/T 20984-2022《信息安全技术信息安全风险评估方法》解读

对GB/T 20984-2007《信息安全技术信息安全风险评估规范》和GB/T 20984-2022 《信息安全技术信息安全风险评估方法》主要差异进行叙述。

overfit同步小助手 2023-03-30 21:04:33 0 收藏

华数杯2023A题思路+雅鲁藏布江数据

对于问题3，“红旗河”引水工程的引入需要我们考虑其巨大的投资成本，因此与问题1和问题2不同，我们需要重新考虑一些因素。因此，收集问题a的数据是一个很大的问题。至于如何量化印度因素，这里可以收集印度对中国的关税和一些相关的政策数据，还可以收集印度赴中国旅游的人数，以进行约束控制。对于这个问题，我们需要

overfit同步小助手 2023-03-30 21:04:30 0 收藏

字节、腾讯争先部署，ClickHouse+Doris 赶超 MySQL 810 倍

里流传着这样一句话，作为大数据从业者，你一定明白有数据是一回事，可要想是另一回事。如何实现智能路径检测，查询出符合条件的路径详情及符合路径的用户数？关于有序漏斗转化，如果想要更准确一些该怎么做？面对大量的订单记录，如果想按照地域、时间、来源等维度等进行实时分析，该怎么实现？对于海量评论数据，想要查询

overfit同步小助手 2023-03-30 21:04:26 0 收藏

Hadoop高可用搭建（一）

overfit同步小助手 2023-03-30 21:04:23 0 收藏

CDH6.3.2处理Zookeeper因未授权访问造成的漏洞

不知道你有没有注意，zk服务端启动后，默认会启动这几个具有world和cdrwa权限的znode，“/” “/zookeeper” “/zookeeper/config"和”/zookeeper/quota"（根据zookeeper的版本不同可能存在不同，并且这几个节点虽然具有world和cdrwa

overfit同步小助手 2023-03-30 20:05:19 0 收藏

Flink 1.13 源码解析——Flink 作业提交流程上

Flink 1.13 源码解析 Flink 作业提交流程

overfit同步小助手 2023-03-30 20:05:16 0 收藏

spark为什么比hadoop快

spark为什么快

overfit同步小助手 2023-03-30 20:05:12 0 收藏

hive安装 ———附下载链接、安装过程中所遇问题及解决办法（linux）

一、前期准备1. hive 及相关配置文件下载1. hadoop集群2. 安装mysql二、安装hive1. 解压并安装 Hive 使用下面的命令，解压 Hive 安装包：2.配置 MySQL3.配置 Hive5.启动 Hive6. 配置hive下的mysql数据库7.验证 Hive 安装是否成功三

overfit同步小助手 2023-03-30 20:05:03 0 收藏

Hive 搭建（将 MySQL 作为元数据库）

安装 Hive 之前请先确保你当前已经安装好了 Hadoop，并且运行正常。

overfit同步小助手 2023-03-30 20:05:00 0 收藏

MQTT的Java代码实现

MQTT基于SpringBoot框架实现

overfit同步小助手 2023-03-30 20:04:57 0 收藏

统计学习方法笔记（理论+实例+课后习题+代码实现）：感知机

统计学习方法笔记，感知机，线性分类模型

overfit同步小助手 2023-03-30 20:04:51 0 收藏

【MDPI出版社】3区SCI、大数据、图像、信号处理、深度学习、物联网、无线通信等领域均可，仅2-3个月左右录用

【期刊简介】IF：2.5-3.0，JCR3区，中科院3/4区。【期刊简介】IF：3.0-4.0，JCR2/3区，中科院4区。【期刊简介】IF：3.5-4.0，JCR2区，中科院3/2区。【期刊简介】IF：3.0-4.0，JCR2区，中科院3/4区。【期刊简介】IF：3.0-4.0，JCR2区，中科院

overfit同步小助手 2023-03-30 20:04:46 0 收藏

SpringBoot整合RabbitMQ

spring_topic_exchange交换机，绑定了spring_topic_queue_start、spring_topic_queue_swell、spring_topic_queue_well2。spring_fanout_exchange交换机，绑定了spring_fanout_queu

overfit同步小助手 2023-03-30 20:04:43 0 收藏

openpyxl和pandas简单比对

关于Excel数据处理，Pyhton有pandas库和openpyxl、xlwings 模块模块可以对Excel数据进行处理，下面对pandas和openpyxl处理数据进行简单比对。

overfit同步小助手 2023-03-30 20:04:40 0 收藏

消除数据冗余的方法有哪些,处理冗余数据的方法

数据冗余指数据之间的重复，也可以说是同一数据存储在不同数据文件中的现象。可以说增加数据的独立性和减少数据冗余为企业范围信息资源管理和大规模信息系统获得成功的前提条件。数据冗余会妨碍数据库中数据的完整性(integrality)，也会造成存贮空间的浪费。尽可能地降低数据冗余度，是数据库设计的主要目标之

overfit同步小助手 2023-03-30 20:04:37 0 收藏

面试官：MQ的好处到底有哪些？

MQ全称为Message Queue，消息队列是消息在传递过程中的容器，消息队列常用于分布式系统之间的通信消息队列中间件是分布式系统中重要的组件，主要解决应用耦合，异步消息，流量削锋等问题实现高性能，高可用，可伸缩和最终一致性架构；使用较多的消息队列有ActiveMQ，RabbitMQ，ZeroMQ

overfit同步小助手 2023-03-30 20:04:29 0 收藏

Python三方库：RabbitMQ基本使用

overfit同步小助手 2023-03-30 20:04:23 0 收藏

RocketMQ常见问题及解决方案

RocketMQ FAQ1）消费端处理消息发生异常没有捕获或是因为其他原因，没有返回消费状态解决方案：消费端捕获异常，如果需要重试，返回ConsumeConcurrentlyStatus.RECONSUME_LATER，如果不需要重试，返回ConsumeConcurrentlyStatus.RECO

overfit同步小助手 2023-03-30 20:04:20 0 收藏

互联网：常见运营术语，PV、UV、GMV、CVR等

overfit同步小助手 2023-03-30 19:05:19 0 收藏

ELK分布式日志收集快速入门-（一）-kafka单体篇

，消息偏移量：” + consumerRecord.offset());安装遇到的问题（由于网站证书不安全导致）服务器端测试kafka发送消息和消费消息。安装教程自行百度-这个比较简单。zookeeper安装参考地址（修改zookeeper配合文件。查看已经创建的topic。下载k

overfit同步小助手 2023-03-30 19:05:14 0 收藏