大数据开发治理平台 DataWorks
结合业务过程的规划,梳理分析各业务过程中可能产生的实际数据,将这些实际数据字段通过明细表的方式存储下来。当企业业务比较复杂,不同类型业务彼此间需要共享数据域,但是又希望能在模型设计和应用过程中快速定位本业务的数据时,您可结合真实业务情况,规划不同的业务分类,在后续建模的维度表和明细表中,将其关联到对
毕业设计 大数据房价数据分析及可视化 - python 房价分析
网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。爬虫对某一站点访问,如果可以访问就下载其中的网页内容,并且通过爬虫解析模块解析得到的网页链接,把这些链接作为之后的抓取目标,并且在整个过程中完全不依赖用户,自动运行。若不能访问则根据爬虫预先设定的策略进行下一个 URL的访问。在整个过
hive真实表空间大小统计
如果是采用hdfs上传加载的表、或者是flume直接写hdfs的表空间通常看hive的属性是不准确的。
Java 使用Websocket 与MQ消息队列实现即时消息
java使用websocket与MQ结合使用,实现即时消息
JAVA操作RabbitMQ
rabbitMQ的单机安装,常见的模型JAVA调用,springboot整合调用
RabbitMQ-管理界面介绍
connections:无论生产者还是消费者,都需要与 RabbitMQ 建立连接后才可以完成消息的生产和消费,在这里可以查看连接情况。Queues:队列,就是消息队列,消息存放在队列中,等待消费,消费后会被移除队列。channels:通道,建立连接后,会形成通道,消息的投递获取依赖的通道。Exch
HBase基于HDFS上是如何完成增删改查功能的
HDFS只支持文件append操作, 而依赖HDFS的HBase如何完成增删改查功能?
Scala --- Array方法大全(一)
Scala --- Array方法大全
linux 部署Hadoop完全分布式集群教程
linux 部署Hadoop完全分布式集群教程
Java 17 VS Java 8: 新旧对决,这些Java 17新特性你不容错过
Java是一门非常流行的编程语言,由于其跨平台性、可移植性以及强大的面向对象特性而备受青睐。Java最初由Sun Microsystems公司于1995年推出,随着时间的推移,Java发展迅速,版本不断更新。本篇博客将重点介绍Java 17与Java 8的对比,以及Java 17的新特性。
Hive的Join操作
Hive的Join操作
es 启动elasticsearch.bat发生闪退
在bin目录下输入elasticsearch.bat启动,发生报错,查看Caused by 的后面的错误信息,发现是elasticsearch.yml配置文件的编码格式错误。打开我的elasticsearch.yml配置文件 发现我的注释是中文,所有要使用utf-8的编码格式。最后说一句,方法有很多
Ansible 自动化运维
自动化运维参考
SQL窗口函数可视化详解
“Window”或 <Aggregate> OVER (PARTITION ... SORT BY ...) 是SQL中高级并且非常实用的函数。尽管大多数教程未能准确地可视化窗口函数是如何逐步工作的,所以我整理了一些不错的 GIF,它们可以对窗口函数更完整的可视化。
数据架构:Data Fabric和Data Mesh介绍和对比
Data Mesh和Data Fabric是两种不同的数据架构模式,Data Mesh强调分散数据管理和数据可观性和透明度,Data Fabric强调集成和访问的中心化控制和灵活性,两者在实际应用中可以相互补充。
Data Mesh和数据中台
虽然“数据中台”这个概念在近年来逐渐流行起来,但它并不是一个严格的定义,而是一个比较模糊的概念,具有一定的抽象性。在实际应用中,“数据中台”往往表达的是一种数据的使用和管理方式,而不是一个具体的技术平台。
flink cdc 没有Replication client ,Replication slave权限,报错,处理
fiink cdc 的表用户,需要有Replication client ,Replication slave权限。授权命令如下: grant Replication client on *.* to ods_base@'%'; grant replication slave on *.* to o
什么是Kubernetes
K8s-Kubernetes1.什么是Kubernetes Kubernetes是Google公司在2014年6月开源的一个容器集群管理系统,使用Go语言开发,也叫K8S。Kubernetes的目标是让部署容器化的应用简单并且高效,Kubernetes提供了应用部署,规划,更新,维
Pytorch固定随机种子&&复现模型
PyTorch固定随机数种子结果可复现