大数据 - overfit.cn

【面试】ZooKeeper面试题

一次性无论是服务端还是客户端，一旦一个 Watcher 被触发，Zookeeper 都会将其从相应的存储中移除。这样的设计有效的减轻了服务端的压力，不然对于更新非常频繁的节点，服务端会不断的向客户端发送事件通知，无论对于网络还是服务端的压力都非常大。客户端串行执行客户端 Watcher 回调的

overfit同步小助手 2023-04-23 23:03:54 0 收藏

熟悉常用的HDFS操作（大数据技术原理与应用-第三章实验）

一、HDFS shell命令首先启动Hadoop，命令如下：cd /usr/local/hadoop/sbinstart-dfs.sh在终端输入如下命令，查看hdfs dfs总共支持哪些操作：cd /usr/local/hadoop/binhdfs dfs上述命令执行后，会显示如下的结果：如果显示W

overfit同步小助手 2023-04-23 23:03:45 0 收藏

RabbitMQ的消息补偿机制

文章目录前言一、pandas是什么？二、使用步骤 1.引入库 2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一

overfit同步小助手 2023-04-23 22:04:01 0 收藏

Bi系统跟数据中台的区别是什么？

换句话来说，BI是一套完整的解决方案，可以将来自企业的不同业务系统（如ERP、CRM、OA、BPM等，包括自己开发的业务系统软件）的数据，提取出有用的数据进行整合清洗，在保证数据正确性的同时，进行数据分析和处理，并利用合适的查询和分析工具快速、准确地为企业提供报表展现与分析，为企业提供决策支持。总的

overfit同步小助手 2023-04-23 22:03:48 0 收藏

Power BI介绍

Power BI是由微软研发的一款商业智能分析软件，是一款可视化自助式BI工具。核心理念：让业务人员无须编程就能快速上手商业大数据分析与可视化，具有丰富的可视化图表组件，跨设备使用、与各种不同系统无缝对接和兼容Power BI是我可以接入各个数据，来做一些处理和汇总。做报表的过程：读数据——做报表—

overfit同步小助手 2023-04-23 22:03:36 0 收藏

Flink_CDC搭建及简单使用

Flink_CDC搭建及简单使用1.CDC简介： CDC （Change Data Capture），在广义的概念上，只要能捕获数据变更的技术，都可以称为 CDC 。但通常我们说的CDC 技术主要面向数据库（包括常见的mysql,Oracle, MongoDB等）的变更，是一种用于

overfit同步小助手 2023-04-23 21:03:41 0 收藏

大数据前端可视化大屏--前端开发之路

可视化常用组件有哪些？常用的技术栈是什么？可视化的常见问题有哪些如何解决？一、什么是可视化大数据可视化这词相信大家并不陌生，从 17 世纪的地图和图形到 19 世纪初饼图的发明，使用图表来理解数据的概念已经存在了数个世纪。可视化一直伴随着我们的生活，在我们的生活中更是无处不在，像天猫双十一、女神节

overfit同步小助手 2023-04-23 20:03:43 0 收藏

HIVE表 DML 操作——第3关：将 select 查询结果插入 hive 表中

命令可以操作在表和特定的分区上，如果属于分区表，必须指明所有分区列和其对应的分区列属性值。为了完成本关任务，你需要掌握：1. 单表插入，2. 多表插入。表应用不同的查询规则从扫描结果中获取目标数据插入到不同的。该方法会覆盖表或分区中的数据（若对特定分区指定。多表插入操作的开始第一条命令指定所有表

overfit同步小助手 2023-04-23 20:03:38 0 收藏

【李老师云计算】HBase+Zookeeper部署及Maven访问（HBase集群实验）

HBase+Zookeeper部署及Maven访问（HBase集群实验）

overfit同步小助手 2023-04-23 19:03:51 0 收藏

Hadoop集群间文件拷贝

文章主要介绍了Hadoop集群减文件拷贝的使用，借助源码简要分析了拷贝过程。

overfit同步小助手 2023-04-23 19:03:35 0 收藏

datax与多种数据库间数据类型映射

datax与数据库的数据类型映射

overfit同步小助手 2023-04-23 18:03:52 0 收藏

spark- Dataframe基本操作-查询

查询相关操作.show() 显示头n 行.printSchema() 打印表概要，.count() 查询统计表中数据行数.distinct() 去重后的数据.collect()获取所有数据到数组.head(num) 以及.take(num) 获取前num行记录.sample() 采样.select(

overfit同步小助手 2023-04-23 18:03:43 0 收藏

重磅通知！OpenAI又放大招：官宣开放API接口-3.5版本需求大涨，机遇与挑战并存，谁能拔得头筹？

OPenAI开放模型，为类人工智能应用的发展提供了加速器。随着越来越多的应用程序搭载人工智能技术，将引发对算力的巨大需求，这也为公司提供了巨大的发展空间。

overfit同步小助手 2023-04-23 18:03:38 0 收藏

大数据存储组件TiDB原理+实战篇

大数据组件TiDB原理+实战篇

overfit同步小助手 2023-04-23 18:03:35 0 收藏

RabbitMQ——延迟队列

采取定时任务轮训数据库订单，并且批量处理。其弊端也是显而易见的；对服务器、数据库性会有很大的要求，并且当处理大量订单起来会很力不从心,而且实时性也不是特别好。当然传统的手法还可以再优化一下，即存入订单的时候就算出订单的过期时间插入数据库，设置定时任务查询数据库的时候就只需要查询过期了的订单，然后再做

overfit同步小助手 2023-04-23 15:03:40 0 收藏

spark-在IDEA中搭建scala编程环境

入门spark-rdd编程

overfit同步小助手 2023-04-23 13:03:39 0 收藏

Hive 表 DML 操作第1关：将文件中的数据导入（Load）到 Hive 表中

overfit同步小助手 2023-04-23 11:03:39 0 收藏

揭秘阿里巴巴数据治理平台建设经验

00前言阿里巴巴一直将数据作为自己的核心资产与能力之一，通过多年的实践探索建设数据应用，支撑业务发展。在不断升级和重构的过程中，我们经历了从分散的数据分析到平台化能力整合，再到全局数据智能化的时代。如今，大数据平台面临全新的挑战，特别是降本等数据治理需求的不断出现，今天阿里云 DataWorks

overfit同步小助手 2023-04-23 11:03:35 0 收藏

Elasticsearch 核心技术（九）：搜索结果处理（分页、排序、指定返回字段、去重、高亮显示）

本篇主要讲述 Elasticsearch 关于搜索结果的处理，主要内容有：分页查询、结果排序、指定返回字段、去重、高亮显示等。

overfit同步小助手 2023-04-23 11:03:31 0 收藏

mysql数据库密码

mysql修改密码

overfit同步小助手 2023-04-23 10:03:49 0 收藏