大数据 - overfit.cn

Kafka如何保证数据高可靠

生产者只要将数据发送到leader副本，kafka就会返回ack，leader中的数据先在缓存中，数据写磁盘需要一段时间。ISR假设为空，或者小于最小副本数，生产者往Kafka写数据的时候一直会报错，不能说它一报错Kafka生产者就直接终止，我们肯定要设置一个重试次数，来提升程序的健壮性。这种情况下

overfit同步小助手 2023-06-25 11:04:05 0 收藏

帆软初级证书第一部分 Fine Report 答案（二）

overfit同步小助手 2023-06-25 10:04:26 0 收藏

Hive数据操作

hive学习02-数据操作

overfit同步小助手 2023-06-25 09:04:19 0 收藏

山东大学2022年6月27日软件学院数据库系统期末考试回忆版

overfit同步小助手 2023-06-25 09:04:02 0 收藏

spark第四章：SparkSQL基本操作

接下来我们学习SparkSQL他和Hql有些相似。Hql是将操作装换成MR，SparkSQL也是，不过是使用Spark引擎来操作，效率更高一些SparkSQL的常用操作基本就这些,至于项目吗,下次专门在写一次吧。

overfit同步小助手 2023-06-25 08:04:14 0 收藏

浅谈【AI、算力赋能】“大算力”时代的到来

🙈AI人工智能是否可以取代人类？🙈应不应该限制人工智能的发展？🙈 AI研究及龙头行业迎来哪些时代机遇与挑战？🙈 AI人工智能可能会怎样危害人类？

overfit同步小助手 2023-06-25 08:01:40 0 收藏

分布式计算----期末复习题（仅供参考）

单独看yarn的进程：start-yarn.sh ，出现resourcemanager（主节点），nodemanager（从节点）。(3) core- site.xml作用: 配置NameNode的所在主机或者通讯地址及NameNode格式化后的目录的路径。3.如果你使用的是Hadoop3.x版本，

overfit同步小助手 2023-06-25 00:04:12 0 收藏

Kylin (一) ---------- 概述

kylin 概述

overfit同步小助手 2023-06-24 23:04:38 0 收藏

数据湖——Hudi基本概念

hudi

overfit同步小助手 2023-06-24 23:04:24 0 收藏

超级独角兽 Databricks 的崛起之路

overfit同步小助手 2023-06-24 23:03:53 0 收藏

大数据的常用算法（分类、回归分析、聚类、关联规则、神经网络方法、web数据挖掘）

在大数据时代，数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程，也是一种决策支持过程。其主要基于，模式学习，统计学等。通过对大数据高度自动化地分析，做出归纳性的推理，从中挖掘出潜在的模式，可以帮助企业、商家

overfit同步小助手 2023-06-24 19:04:36 0 收藏

Hadoop大数据处理与分析教程

本文所需文件(Vmware虚拟机、密匙、乌班图系统、JDK、Hadoop）链接：https://pan.baidu.com/s/1yU5s36Rgl_jE_mAmHsJBfQ?pwd=i5s6提取码：i5s6。

overfit同步小助手 2023-06-24 18:04:21 0 收藏

Flink概念及应用场景

flink应用场景及架构

overfit同步小助手 2023-06-24 15:04:31 0 收藏

Kafka

大数据面试- Kafka

overfit同步小助手 2023-06-24 14:04:03 0 收藏

Hive | 报错锦集

Hive使用过程中遇到的部分问题分享，快来看看吧！

overfit同步小助手 2023-06-24 12:04:08 0 收藏

Hive+Spark离线数仓工业项目--ODS层及DWD层构建（2）

Hive+Spark离线数仓工业项目--ODS层及DWD层构建

overfit同步小助手 2023-06-24 11:04:25 0 收藏

hadoop环境新手安装教程

这一步需要对hadoop下的 core-site.xml、hadoop-env.sh、hdfs-site.xml、mapred-site.xml、yarn-site.xml等文件进行配置。这里我用了3台虚拟机，1台改为master，另外2台分别改为node1和node2。（3）IP地址改写，这里需要

overfit同步小助手 2023-06-24 04:04:08 0 收藏

大学数据库创建与查询实战——数据库表设计

FOREIGN KEY外键（既可以定义列也可以定义表）CHECK约束用于限制列中的值的范围（既可以定义列也可以定义表）大学数据库的整体设计

overfit同步小助手 2023-06-24 02:02:52 0 收藏

hadoop-hdfs集群安全模式详解

安全模式相关命令查看安全模式 hdfs dfsadmin -safemode get进入安全模式状 hdfs dfsadmin -safemode enter离开安全模式 hdfs dfsadmin -safemode leave等待安全模式状态 hdfs dfsadmin -safemode

overfit同步小助手 2023-06-23 22:08:02 0 收藏

大数据Doris（三十九）：Spark Load 注意事项

3、使用Spark Load时spark_home_default_dir配置项没有指定spark客户端根目录,提交Spark job 时用到 spark-submit 命令，如果 spark_home_default_dir 设置错误，会报 Cannot run program "xxx/bin/

overfit同步小助手 2023-06-23 22:04:11 0 收藏