kylin的介绍

Kylin是一个开源的分布式分析引擎,主要用于快速查询大数据集合。

Hadoop大数据平台搭建(超详细步骤)

Hadoop大数据平台搭建

Spark学习笔记(三)

SparkSQL

【电商】电商后台系统整体介绍

从三大方面,对电商后台系统进行了整体的介绍

HDFS常用命令操作时

HDFS常用命令的实践操作

kafka中topic的创建和查询

kafka topic

一篇文章让你理解 大数据所需要的组件

一篇文章让你理解 大数据所需要的组件

windows安装scala

windows安装scala

大数据常见术语

大数据常见术语一览主要内容包含以下(收藏,转发给你身边的朋友)雪花模型、星型模型和星座模型事实表维度表上钻与下钻维度退化数据湖UV与PV画像ETL机器学习大数据杀熟SKU与SPU即席查询数据湖数据中台ODS,DWD,DWS,DWT与ADST0与T+1用户画像用户画像又称用户角色,作为一种勾画目标用户

头歌 HBase(相关的五个实验)

头歌 HBase(相关的五个实验)

Kafka消息底层存储结构介绍

Kafka的底层消息存储架构

Kafka系列 - 06 Kafka 集群环境搭建(三台服务器)

hadoop-101 虚拟机的 IPADDR 的地址改为:192.168.38.23;hadoop-103 虚拟机的 hostname 的地址改为:hadoop103;kafka集群搭建,需要3台虚拟机环境,但是我目前只安装了一台虚拟机,因此还需要准备两台虚拟机环境,正常情况下应该再安装2台虚拟机,

【NLP】AI相关比赛汇总(2022)

主要查找的是国内的一些比赛平台。以往举办的一些平台不能够访问的,或者比赛列表中近年来没有相关比赛的就没有放上去。读者可以根据自己的喜好选择合适自己的平台进行学习和演练,好运哦。当然,以上平台也是从互联网中查找的也不一定全面,欢迎补充。......

数据湖系列文章

数据湖是一种在系统或存储库中以自然格式存储数据的方法,它有助于以各种模式和结构形式配置数据,通常是对象块或文件。数据湖的主要思想是对企业中的所有数据进行统一存储,从原始数据(源系统数据的精确副本)转换为用于报告、可视化、分析和机器学习等各种任务的目标数据。数据湖中的数据包括结构化数据(关系数据库数据

保姆级深度学习环境搭建(亲测避坑)

踩坑结束,大家可以躺平了

浅谈CVPR2022的几个研究热点

CVPR2022刚刚结束,作为影响力最广的视觉盛会,今年又有一批优秀的工作被展示出来。相信关注视觉最新研究进展的各位小伙伴,已经磨拳擦掌,准备向CVPR2023投稿了。基于今年的工作,到底哪些领域是CVPR关注的热点?哪些领域的工作,接受度更高,oral的比例更大呢?基于CVPR官方最新的统计信息,

Datax与Datax-Web安装部署

详细记录了datax与datax-web安装部署过程。

hadoop格式化时报错

Re-format filesystem in Storage Directory root= /data/hadoop/hdfs/name; location= null ? (Y or N)

查es大于10000条数据-滚动查询(scroll)

查es大于10000条数据-滚动查询(scroll),总所周知,es一般查询只支持最多查询出前1w条数据,很难受。想要一次性查询出你想要的数据,一些大数据的场景下,我们需要用到ElasicSearch的两种查询方式:==深度分页==或者==滚动查询==,我们今天使用的是滚动查询方式,因为需要一批次加

Nacos 配置中心使用详解

nacos config配置中心使用详解

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈