实验3 - HDFS的管理和使用
hadoop
HBase的编程实践(实验3_熟悉常用的HBase操作)
HBase的编程实践(实验3_熟悉常用的HBase操作)
Flink 系例 之 Dashboard 安装与界面操作
前期入门讲解了需多常用算子、方法、和连接器的使用与代码示例,本文讲解如何安装 Apache Flink Dashboard 平台与界面基本操作。
Java面试题总结-2022版
Java面试题总结2022
微服务注册中心之Zookeeper,Eureka,Nacos,Consul,Kubernetes区别
对于如何选择这两种方式,其实还有一个数据一致性问题可以聊聊,比如选择定时器肯定就抛弃了强一致性,最后要求的是最终一致,这里就不深入展开了,另外你可能还会说服务的移除等等这些功能都没介绍,在我看来那只是一个附加功能,注册中心重点还是在于服务注册和发现,其他都是锦上添花罢了。更重要的是,当服务注册中心不
【案例实战】Java整合hudi-client 0.11.1
Java-Api整合Hudi,操作Hudi的增删改。
为什么要进行数据治理
数据治理的必要性
怎么自学python?为什么选择python
自然是因为Python简单易学且应用领域广Python近段时间一直涨势迅猛,在各大编程排行榜中崭露头角,得益于它多功能性和简单易上手的特性,让它可以在很多不同的工作中发挥重大作用。正因如此,目前几乎所有大中型互联网企业都在使用 Python 完成各种各样的工作,比如Web应用开发、自动化运维、人工智
RabbitMQ的安装和配置
rabbitMQ的安装和遇到的一些问题
系统集成项目管理工程师(软考中级)—— 第十六章 项目人力资源管理 笔记分享
确定项目的角色、职责以及汇报关系,并编制人员配备管理计划作为项目最初阶段的一部分。但是,这一过程的结果应当在项目的整个生命周期中进行经常性地复查,以保证它的持续适用性。如果最初的项目人力资源计划不再有效,就应当立即修正总是与沟通计划编制过程紧密联系,项目组织结构会对项目的沟通需求产生重要影响要注意到
基于机器学习的异常检测与分析技术
传统的运维方式在监控、问题发现、告警以及故障处理等各个环节均存在明显不足,需要大量依赖人的经验,在数据采集、异常诊断分析、故障处理的效率等方面有待提高。本关键技术面对传统运维故障处理效率低、问题定位不准确、人力成本高三大痛点,将人工智能与运维相结合,由AI逐步取代人力决策,通过机器学习方法,快速给出
Hadoop下载与安装
从http://archive.apache.org/dist/hadoop/core/下载Hadoop-3.0.0,下载二进制压缩包文件:hadoop-3.0.0.tar.gz。https://blog.csdn.net/tototuzuoquan/article/details/79954234
【hbase】按时间段批量删除hbase数据
背景是华为大数据平台mrs,这里运用到HDFS、Hive、HBase;数据通过接口接入到hbase,用hive创建hbase外部表。需求是某段时间数据有问题,需要删掉重新补入。
大数据毕业设计题目50例
大数据毕业设计题目50例,该大数据毕业设计题目包含了:“放管服”环境下科技政务大数据平台研究,大数据对会计的挑战及其应对策略试析,新疆畜牧业进入大数据时代,大数据时代高校教学实效问题与路径选择,大数据背景下互联网技术在泾阳县蔬菜种植农业供给侧结构性改革中的应用等。...
虚拟机本地搭建Hadoop集群教程
本地使用VirtualBox三台虚拟机搭建hadoop集群
spark法律服务大数据智能推荐(自己动手做的,完整过程+源码)
与搜索引擎不同,推荐系统并不需要用户提供明确的需求,而是通过分析用户的历史行为,主动为用户推荐能够满足他们兴趣和需求的信息。为了能够更好地满足用户需求,需要依据其网站的海量数据,研究用户的兴趣偏好,分析用户的需求和行为,发现用户的兴趣点,从而引导用户发现自己的信息需求,将长尾网页(长尾网页是指网页的
rabbitmq添加用户,虚拟机步,设置rabbitmq配置文件
rabbitmq修改配置文件
DataHub调研&数据血缘
在DataHub中可以通过GraphQL API轻松的创建和添加任何实体标签,这样随着时间的推移,实体的属性回越来越丰富。当有一天我们想要查看某一标签的相关实体信息时,只需要在标签位置点击该标签,就会将所有相关的实体数据 列出来。
什么是一网统管?终于有人讲明白了
导读:本文给出了一网统管的定义,介绍了其定位、目标和支撑的业务范畴。作者:郑宇来源:大数据DT(ID:hzdashuju)01一网统管的定义定义:一网统管是打通城市各治理系统的业务平台、管理全域的实体中心和整合治理力量的协同模式,通过技术创新、机制创新和组织创新,实现一张网络管全城、一个中心管全域、
Flink简介、基本原理、架构图
Flink是一款支持有状态运算的流计算引擎。支持有状态运算是指数据的计算过程中可以保存计算的中间过程状态,比如我们要计算一个整数数据流的求和,那么我们就需要一个中间变量把数据流中的每一项数据加到这个变量上。而这个变量就是计算的中间状态。Flink框架会帮你管理状态的保存和复原。流计算是指我们要针对一