Spark - LeftOuterJoin 结果条数与左表条数不一致
使用 spark lefOuterJoin 寻找下发的 gap,用原始下发 rdd 左join 真实下发后发现最终的结果数与左表不一致,左表数据: 20350,最终数据: 25721。一直以来使用 Hive 都是默认 leftJoin 左表应该与结果一致,所以开始排查。......
第六章 dubbo接口测试
dubbo接口测试下载zookeeper 的压缩包,点此下载。解压到你要存储的目录,找到zookeeper配置⽂件,在conf ⽬录下,用文本编辑器打开zoo.cfg,修改⾥⾯的内容:tickTime:zookeeper 服务器之间或客户端与服务器之间维持⼼跳的时间间隔,也就是每个 tickTim
Linux环境下zookeeper的安装教程(超详细!!)
zooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。............
200+ Java常见面试题总结《最少必要面试题》
这份【Java常见面试题总结】我想准备很久了,前面做面试官,后来自己也面了很多一线二线互联网公司,希望通过当下真实经历做一份面试题总结,助力金九银十,喜提心仪 Offer。pub哥刚开始找工作时,觉得看面试题再找是作弊行为,不屑于刷题,干看技术教程。其实不然:目前打算从如下几个模块开始,包含 Jav
写给刚入学大数据专业或迷茫在为几两碎银转行的你
你有没有想过你要怎么计划去学习呢?
ElasticSearch、kibana设置账户密码;ElasticSearch对外访问
今天在linux服务器上搭建elasticsearch索引库,但这段时间正在搞护网行动,所以elasticsearch和kibana就不能裸奔了,所以这篇文章我写了如何设置账户密码
从学生到工程师的蜕变之路
夏日炎炎,热浪中我们迎来毕业季,这是告别,也是迈向新起点的开始,CSDN诚邀各毕业生/在校生/职场人讲述自己的毕业季故事,分享自己的经验,技术er的进击之路,等你来书写!你可以选择适合自己的对应身份从以下相关内容方向着笔,也可从自身经历出发,贴合活动主题参与投稿,文章题目自拟。从业五年,工作内容是主
arthas监控Java程序性能
二、监控进程执行命令后选择要监控的进程三、dashboard四、火焰图
zookeeper入门到精通06——zookeeper客户端API创建节点
zookeeper是常用的微服务技术栈,本文将通过一个实例带大家使用客户端api远程创建zookeeper节点
【分布式&微服务】RabbitMQ实践
RabbitMQ的简单使用
一零一一、import spark.implicits._写完立即消失
import spark.implicits._写完立即消失
大数据必学Java基础(二):Java核心机制
垃圾收集的目的在除不再使用的对象,当对象建立的时候垃圾收集期,就开始监控对象的动态情况,垃圾收集主要是对内存的释放。创建对象的时候申请一个空间存储空间的分配情况。在JVM的空闲时,检查并释放可被释放的存储器空间;相比c++,开发人员负责要自己收回无用内存。后续更高级的内容介绍:1.垃圾收集器有几种2
青春散场,初心不忘【致毕业季理想主义的你】
在看到C站这个活动的时候,我在内心纠结许久。作为一个在职场已经工作11年的老人,早已褪去了青春的色彩,没了年少轻狂,没了热血激昂,还能有多少热血的文字送给毕业季的你们呢?
Deepin安装RabbitMq
使用Deepin安装RabbitMQ进行日常开发
MQ如何保证消息不丢失
如何保证MQ消息不丢失
大数据毕业设计选题推荐(二)
这是学长亲手整理的,大数据毕设选题系列第二篇,都是经过学长精心审核的题目,适合作为毕设,难度不高,工作量达标,对毕设有任何疑问都可以问学长哦!学长整理的题目标准:基于hadoop的工作流调度的研究基于Hadoop的公共自行车数据分布式存储和计算基于HHT的大规模网络流量数据处理方法研究金融大数据背景
【kafka专栏】生产者同步及异步发送数据三种方式
apache kafka生产者客户端三种同步及异步发送数据的方式
hadoop综合实验(对日志的处理mapreduce保存到csv)
综合实验:网站访问日志采集、处理及分析实验步骤注:截图必须使用实验机的带水印截图功能,题目中要求截图但未提供的视为未做一、使用Flume导入日志数据数据文件下载地址:新建一个待监控的文件夹,放入三个日志文件我这里是lhx1、(代码)创建flume配置,文件内容及部分属性注释(注意路径):2、(截图)
【Spring常见错误】Rocketmq 闪退
🙊🙊作者主页:🔗求不脱发的博客📔📔精选专栏:🔗Spring📋📋精彩摘要:rocketmq是一个分布式消息和流数据平台。rocketmq本文将介绍在安装后双击 rocketmq\bin下的mqnamesrv.cmd命令后,窗口一闪而过的问题。💞💞觉得文章还不错的话欢迎大家点赞👍
Hadoop生态之HDFS
用一万字文章来深层次理解HDFS文件上传系统的底层原理,爆肝半天的极品文章,需要资源私信博主奥里给。。。。