大数据 - overfit.cn

HBase 集群部署与启动

overfit同步小助手 2023-03-31 07:04:47 0 收藏

InfluxDB的查询优化

根据官网整理的Influx脚本的查询优化问题

overfit同步小助手 2023-03-31 07:04:35 0 收藏

解决Hive启动后报错FAILED:HiveException java.lang.RuntimeException

解决Hive启动后报错FAILED:HiveException java.lang.RuntimeException和MetaException(message:Required table missing : “DBS” in Catalog “” Schema “”. DataNucleus r

overfit同步小助手 2023-03-31 07:04:32 0 收藏

Hadoop三大框架之MapReduce工作流程

overfit同步小助手 2023-03-31 07:04:29 0 收藏

PyTorch学习系列教程：何为Tensor？

导读本文继续PyTorch学习系列教程，来介绍在深度学习中最为基础也最为关键的数据结构——Tensor。一方面，Tensor之于PyTorch就好比是array之于Numpy或者DataF...

overfit同步小助手 2023-03-31 07:01:42 0 收藏

一文了解 HDFS 及其组成框架

介绍了HDFS是什么、HDFS的优缺点，NameNode节点、DataNode节点、SecondaryNameNode节点的定义及功能介绍。

overfit同步小助手 2023-03-31 06:05:16 0 收藏

数据开发面试问题记录

因作者近期正在投递数据开发岗位，所以会在此记录一些面试过程中的问题，持续更新，直到入职新公司为止

overfit同步小助手 2023-03-31 06:05:12 0 收藏

elasticsearch——jdk版本问题，非docker版直接使用安装包。

elasticsearch——jdk版本问题

overfit同步小助手 2023-03-31 06:05:09 0 收藏

ElasticSearch7.X和ElasticSearch8.X学习记录

当我们使用sql进行查询时，假如总共有3天数据，但是我们的查询语句只需要返回2条数据，则剩下的这条数据就会进入cursor中，在后续查询中，可以直接使用cursor进行查询，只可以取用一次，多次使用时，结果是返回空，游标是消耗性能的，可以使用close进行关闭。为防止数据节点宕机或者挂掉，影响服务的

overfit同步小助手 2023-03-31 06:05:04 0 收藏

TDengine 压缩性能实际测试（对比 DolphinDB ）

目前市面上主流的压缩算法都是公开的，各家产品所采用的压缩算法之间并没有太大差距。压缩算法的选择，更多是根据产品定位不同而作出的取舍。压缩和解压本身是需要消耗资源的，并不存在对所有数据都表现优异的压缩算法。TDengine 为了实现性能的超常发挥，采用了大量的非常规（重复、排序）数据进行 Benchm

overfit同步小助手 2023-03-31 06:04:56 0 收藏

Elasticsearch大数据量写入调优和原理解析

spark写入ES参数调优Java restHighLevel API Bulk写入ES调优ES数据写入调优和原理分析

overfit同步小助手 2023-03-31 06:04:33 0 收藏

南京邮电大学数据库第一次课后作业

南京邮电大学数据结构长江雨课堂第一次课后作业

overfit同步小助手 2023-03-31 06:04:30 0 收藏

大数据技术之Hive SQL题库-初级

overfit同步小助手 2023-03-31 06:04:21 0 收藏

【Java 实战】通过ElasticSearch实现全局搜索功能

在电商项目中，我们经常会使用到全局搜索来查询自己想要购买的商品，而商品的数量非常多，而且分类繁杂。面对这样复杂的搜索业务和数据量，使用传统数据库搜索就显得力不从心，一般我们都会使用全文检索技术，比如Solr，`Elasticsearch`。

overfit同步小助手 2023-03-31 06:04:18 0 收藏

Elasticsearch：Text vs. Keyword - 它们之间的差异以及它们的行为方式

很多刚开始学习 Elasticsearch 的人经常会混淆和字段数据类型。它们之间的区别很简单，但非常关键。在本文中，我将讨论两者之间的区别、如何使用它们、它们的行为方式以及使用哪一种。

overfit同步小助手 2023-03-31 05:05:02 0 收藏

大数据开发笔试题整合

overfit同步小助手 2023-03-31 05:04:58 0 收藏

ABC 分析法（帕累托分析法、2/8分析法）

overfit同步小助手 2023-03-31 05:04:28 0 收藏

华为认证HCIP是什么？有什么用？

华为认证是华为技术有限公司（简称“华为”）基于“平台+生态”战略，围绕“云-管-端”协同的新ICT技术架构，打造的业界覆盖ICT领域最广的认证体系

overfit同步小助手 2023-03-31 04:09:19 0 收藏

比Sqoop功能更加强大开源数据同步工具DataX实战

前面两篇连续介绍两个数据同步组件后，好事应有三，大满贯收场，本篇介绍主流的异构数据源离线同步工具DataX的框架设计和执行流程，将其与大名鼎鼎大数据同步组件Sqoop做对比，部署安装并通过配置基于MySQL和HDFS互为读写的实例场景和关键配置说明。

overfit同步小助手 2023-03-31 03:06:13 0 收藏

Hive 数据同步ClickHouse

在开发过程中，需要从HDFS中导入数据到clickhouse中。把所有数据分析相关的日志数据存储至ClickHouse这个优秀的数据仓库之中，当前日数据量达到了300亿。需求：按条件筛选Hive表中的数据同步到ClickHouse中方法一：按照ClickHouse 官方文档提供的方法，在ClickH

overfit同步小助手 2023-03-31 03:05:12 0 收藏