HBase 集群部署与启动
HBase 集群部署与启动
InfluxDB的查询优化
根据官网整理的Influx脚本的查询优化问题
解决Hive启动后报错FAILED:HiveException java.lang.RuntimeException
解决Hive启动后报错FAILED:HiveException java.lang.RuntimeException和MetaException(message:Required table missing : “DBS” in Catalog “” Schema “”. DataNucleus r
Hadoop三大框架之MapReduce工作流程
Hadoop三大框架之MapReduce工作流程
PyTorch学习系列教程:何为Tensor?
导读本文继续PyTorch学习系列教程,来介绍在深度学习中最为基础也最为关键的数据结构——Tensor。一方面,Tensor之于PyTorch就好比是array之于Numpy或者DataF...
一文了解 HDFS 及其组成框架
介绍了HDFS是什么、HDFS的优缺点,NameNode节点、DataNode节点、SecondaryNameNode节点的 定义 及 功能 介绍。
数据开发面试问题记录
因作者近期正在投递数据开发岗位,所以会在此记录一些面试过程中的问题,持续更新,直到入职新公司为止
elasticsearch——jdk版本问题,非docker版 直接使用安装包。
elasticsearch——jdk版本问题
ElasticSearch7.X和ElasticSearch8.X学习记录
当我们使用sql进行查询时,假如总共有3天数据,但是我们的查询语句只需要返回2条数据,则剩下的这条数据就会进入cursor中,在后续查询中,可以直接使用cursor进行查询,只可以取用一次,多次使用时,结果是返回空,游标是消耗性能的,可以使用close进行关闭。为防止数据节点宕机或者挂掉,影响服务的
TDengine 压缩性能实际测试(对比 DolphinDB )
目前市面上主流的压缩算法都是公开的,各家产品所采用的压缩算法之间并没有太大差距。压缩算法的选择,更多是根据产品定位不同而作出的取舍。压缩和解压本身是需要消耗资源的,并不存在对所有数据都表现优异的压缩算法。TDengine 为了实现性能的超常发挥,采用了大量的非常规(重复、排序)数据进行 Benchm
Elasticsearch大数据量写入调优和原理解析
spark写入ES参数调优Java restHighLevel API Bulk写入ES调优ES数据写入调优和原理分析
南京邮电大学数据库第一次课后作业
南京邮电大学数据结构长江雨课堂第一次课后作业
大数据技术之Hive SQL题库-初级
大数据技术之Hive SQL题库-初级
【Java 实战】通过ElasticSearch实现全局搜索功能
在电商项目中,我们经常会使用到全局搜索来查询自己想要购买的商品,而商品的数量非常多,而且分类繁杂。面对这样复杂的搜索业务和数据量,使用传统数据库搜索就显得力不从心,一般我们都会使用全文检索技术,比如Solr,`Elasticsearch`。
Elasticsearch:Text vs. Keyword - 它们之间的差异以及它们的行为方式
很多刚开始学习 Elasticsearch 的人经常会混淆和字段数据类型。它们之间的区别很简单,但非常关键。在本文中,我将讨论两者之间的区别、如何使用它们、它们的行为方式以及使用哪一种。
大数据开发笔试题整合
大数据开发笔试题整合
ABC 分析法(帕累托分析法、2/8分析法)
ABC 分析法(帕累托分析法、2/8分析法)
华为认证HCIP是什么?有什么用?
华为认证是华为技术有限公司(简称“华为”)基于“平台+生态”战略,围绕“云-管-端”协同的新ICT技术架构,打造的业界覆盖ICT领域最广的认证体系
比Sqoop功能更加强大开源数据同步工具DataX实战
前面两篇连续介绍两个数据同步组件后,好事应有三,大满贯收场,本篇介绍主流的异构数据源离线同步工具DataX的框架设计和执行流程,将其与大名鼎鼎大数据同步组件Sqoop做对比,部署安装并通过配置基于MySQL和HDFS互为读写的实例场景和关键配置说明。
Hive 数据同步ClickHouse
在开发过程中,需要从HDFS中导入数据到clickhouse中。把所有数据分析相关的日志数据存储至ClickHouse这个优秀的数据仓库之中,当前日数据量达到了300亿。需求:按条件筛选Hive表中的数据同步到ClickHouse中方法一:按照ClickHouse 官方文档提供的方法,在ClickH