elasticsearch索引按日期拆分和定期删除
ES索引按日期拆分和定期删除,并且不影响原搜索逻辑
一文带你认识AscendCL
AscendCL(Ascend Computing Language,昇腾计算语言)是昇腾计算开放编程框架,是对底层昇腾计算服务接口的封装。
【职业技能大赛】笔记
官网Java,Scala具体位置
【Hive】各种join连接用法
hive join连接的各种用法
zookeeper的leader选举原理和底层源码实现超级详解
zookeeper选举超级详解
Elasticsearch:简体繁体转换分词器 - STConvert analysis
我的前同事 Medcl 大神,在上也创建了一个转换简体及繁体的分词器。这个在我们的很多的实际应用中也是非常有用的,比如当我的文档是繁体的,但是我们想用中文对它进行搜索。
湖仓一体电商项目(九):业务实现之编写写入DIM层业务代码
编写代码读取Kafka “KAFKA-DIM-TOPIC” topic维度数据通过Phoenix写入到HBase中,我们可以通过topic中每条数据获取该条数据对应的phoenix表名及字段名动态创建phoenix表以及插入数据,这里所有在mysql“lakehousedb.dim_tbl_conf
秋招面试题系列- - -Java工程师(四)
答:、、、、,加上动态 sql的 9个标签,其中为 sql片段标签,通过标签引入 sql片段,为不支持自增的主键生成策略标签。原因就是 namespace+id是作为 Map的 key使用的,如果没有 namespace,就剩下 id,那么,id重复会导致数据互相覆盖。不同的 Xml映射文件,如果配
猿创征文|给设备做一个物联网APP-实例详解
随着工业自动化的不断发展,设备入云这门技术也越来越重要,很多人都开启了学习设备入云。然后前面几篇设备入云这一块也讲了好多了,本文呢就介绍设备入云之后自己做一个独立自主的设备客户端APP的实际项目操作。提示:以下是本篇文章正文内容,下面案例可供参考本案例设备是一个水处理设备,包含模拟量输入输出、数字量
windows下rabbitmq安装延时插件(处理各种问题)
windows下rabbitmq安装延时插件(处理各种问题)
flume系列之:基于zookeeper部署flume agent升级guava和curator版本
flume系列之:基于zookeeper部署flume agent升级guava和curator版本
Zookeeper知识点
Zookeeper功能:统一命名服务、分布式注册中心、分布式锁、数据发布/订阅、集群管理、分布式应用配置管理、分布式队列
离线数仓搭架_01_数仓概念与项目框架说明
数据仓库( Data Warehouse ),是为企业制定决策,提供数据支持的。可以帮助企业,改进业务流程、提高产品质量等。
ES可视化工具--elasticsearch-head--下载、安装、使用
本文介绍ES可视化工具--ElasticSearch-Head的下载与安装的方法。
大数据随记 —— DataFrame 与 RDD 之间的相互转换
在 Scala 中,使用 case class 类型导入 RDD 并转换为 DataFrame,通过 case class 创建 Schema,case class 的参数名称会被利用反射机制作为列名。通过 Spark SQL 的接口创建 RDD 的 Schema,这种方式会让代码比较冗长。这种方法
Flink
Flink 是第三代分布式流处理器,它的功能丰富而强大。
docker rabbitmq数据持久化
1,docker volume 或者本地数据目录映射到/var/lib/rabbitmq;2,设定hostname。
安装完全分布式 hive 远程安装时出现错误
/usr/bin/ssh-copy-id : INFO: Source of key(s) to be installed: "/home/hadoop/.ssh/id_rsa.pub"/usr/bin/ssh-copy-id : INFO: attempting to log in with th
大数据项目中数据倾斜
大数据项目中数据倾斜
猿创征文|阿里云MaxCompute存取性能测试报告
前几天公司给我安排了个任务,让我去测试一下阿里云DataWork下的MaxCompute的存取性能,这不,测试报告来了。MaxCompute(ODPS)是适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,以Serverless架构提供快速、全托管的在线数