大数据 - overfit.cn

大数据常见术语一览主要内容包含以下（收藏，转发给你身边的朋友）雪花模型、星型模型和星座模型事实表维度表上钻与下钻维度退化数据湖UV与PV画像ETL机器学习大数据杀熟SKU与SPU即席查询数据湖数据中台ODS，DWD，DWS，DWT与ADST0与T+1用户画像用户画像又称用户角色，作为一种勾画目标用户

overfit同步小助手 2023-03-30 05:05:03 0 收藏

头歌 HBase（相关的五个实验）

overfit同步小助手 2023-03-30 05:05:00 0 收藏

Kafka消息底层存储结构介绍

Kafka的底层消息存储架构

overfit同步小助手 2023-03-30 05:04:49 0 收藏

Kafka系列 - 06 Kafka 集群环境搭建（三台服务器）

hadoop-101 虚拟机的 IPADDR 的地址改为：192.168.38.23；hadoop-103 虚拟机的 hostname 的地址改为：hadoop103；kafka集群搭建，需要3台虚拟机环境，但是我目前只安装了一台虚拟机，因此还需要准备两台虚拟机环境，正常情况下应该再安装2台虚拟机，

overfit同步小助手 2023-03-30 05:04:45 0 收藏

【NLP】AI相关比赛汇总（2022）

主要查找的是国内的一些比赛平台。以往举办的一些平台不能够访问的，或者比赛列表中近年来没有相关比赛的就没有放上去。读者可以根据自己的喜好选择合适自己的平台进行学习和演练，好运哦。当然，以上平台也是从互联网中查找的也不一定全面，欢迎补充。......

overfit同步小助手 2023-03-30 05:04:42 0 收藏

数据湖系列文章

数据湖是一种在系统或存储库中以自然格式存储数据的方法，它有助于以各种模式和结构形式配置数据，通常是对象块或文件。数据湖的主要思想是对企业中的所有数据进行统一存储，从原始数据（源系统数据的精确副本）转换为用于报告、可视化、分析和机器学习等各种任务的目标数据。数据湖中的数据包括结构化数据（关系数据库数据

overfit同步小助手 2023-03-30 05:04:37 0 收藏

保姆级深度学习环境搭建（亲测避坑）

踩坑结束，大家可以躺平了

overfit同步小助手 2023-03-30 05:02:06 0 收藏

浅谈CVPR2022的几个研究热点

CVPR2022刚刚结束，作为影响力最广的视觉盛会，今年又有一批优秀的工作被展示出来。相信关注视觉最新研究进展的各位小伙伴，已经磨拳擦掌，准备向CVPR2023投稿了。基于今年的工作，到底哪些领域是CVPR关注的热点？哪些领域的工作，接受度更高，oral的比例更大呢？基于CVPR官方最新的统计信息，

overfit同步小助手 2023-03-30 05:01:45 0 收藏

Datax与Datax-Web安装部署

详细记录了datax与datax-web安装部署过程。

overfit同步小助手 2023-03-30 04:05:12 0 收藏

hadoop格式化时报错

Re-format filesystem in Storage Directory root= /data/hadoop/hdfs/name; location= null ? (Y or N)

overfit同步小助手 2023-03-30 04:05:08 0 收藏

查es大于10000条数据-滚动查询（scroll）

查es大于10000条数据-滚动查询（scroll）,总所周知，es一般查询只支持最多查询出前1w条数据，很难受。想要一次性查询出你想要的数据，一些大数据的场景下，我们需要用到ElasicSearch的两种查询方式：==深度分页==或者==滚动查询==，我们今天使用的是滚动查询方式，因为需要一批次加

overfit同步小助手 2023-03-30 04:04:47 0 收藏

Nacos 配置中心使用详解

nacos config配置中心使用详解

overfit同步小助手 2023-03-30 04:04:37 0 收藏

kylin的介绍

Hadoop大数据平台搭建（超详细步骤）

Spark学习笔记(三)

【电商】电商后台系统整体介绍

HDFS常用命令操作时

kafka中topic的创建和查询

一篇文章让你理解大数据所需要的组件

windows安装scala

大数据常见术语