大数据 - overfit.cn

Cacti1.2.14最新版安装和配置（详细版）

Cacti的起源与发展现状故事要从2001年的某一天说起。一个叫Ian Berry的中学生还在学习如何使用PHP和MySQL进行编程及功能的实现，那时候他业余时间为一个名不见经传的互联网运营商开发项目，他希望借助这个项目不仅可以精进自己的编程功力，还可以创建一个新的监控显示方法，既要比RRDTool

overfit同步小助手 2023-03-29 11:03:14 0 收藏

基于协同过滤的电商推荐系统（2）：用户对商品的偏好得分

使用协同过滤算法，需要统计用户（User）对物品（Item）的评分（Score），然后依托这些数据进行协同过滤的计算。用户偏好得分 = 行为类型权重 * 行为次数 * 时间衰减系数。

overfit同步小助手 2023-03-29 10:04:53 0 收藏

Apache Doris 安装部署指南

Apache Doris 的安装部署文档，非常适合新手第一次安装部署 Apache Doris，不仅包括 FE、BE 的部署，也包括检查和 WEB UI 的使用，以及一个 DEMO 用例的展示。

overfit同步小助手 2023-03-29 10:04:50 0 收藏

Windows下安装与配置Docker

1、Windows相关启用虚拟化，打开任务管理器，性能，查看虚拟化是否已启用，如下图所示：启用Hyper-v，打开控制面板，启用或关闭Windows功能，勾选Hyper-v，如下图所示： 2、Docker相关下载并安装，下载地址如下所示：https:/

overfit同步小助手 2023-03-29 10:04:44 0 收藏

解决Elasticsearch Connection reset by peer异常

随着ES的密集使用，线上环境，不同应用最近几天陆续有报java.io.IOException: Connection reset by peer异常，感觉不太正常。直接影响就是用户查询或者变更ES数据失败。

overfit同步小助手 2023-03-29 10:04:41 0 收藏

真·实践出Elasticsearch8.0版本安装(指南)

Elasticsearch从入门到大师系列（真指南）Elasticsearch8.0版本安装指南，quickstart，极速进入Elasticsearch学习。

overfit同步小助手 2023-03-29 10:04:39 0 收藏

大数据入门之 Hadoop,HDFS,Hbase,Hive

Hadoop：是泛指大数据生态，实际上基本包括存储(HDFS) + 计算(MapReduce);HDFS: Hadoop分布式文件系统，主要是解决存储的问题;Hbase: 基于Hadoop的高性能nosql数据库;Hive: 最常用的数据仓库;

overfit同步小助手 2023-03-29 10:04:31 0 收藏

Ceph集群部署

说明目标主机已经有ceph.conf配置文件，而且内容和当前目录的配置文件不一样，如果需要覆盖则使用--overwrite-conf选项。如上图，其中：ceph.conf是主配置文件， ceph.client.admin.keyring文件存放的是ceph的用户名和密码。如上图可以看到，会自动远程所

overfit同步小助手 2023-03-29 10:04:26 0 收藏

【博学谷学习记录】大数据课程-学习第七周总结

文件中设置的是Hadoop运行时需要的环境变量。hdfs-default.xml与hdfs-site.xml的功能是一样的，如果在hdfs-site.xml里没有配置的属性，则会自动会获取hdfs-default.xml里的相同属性的值。yarn-default.xml与yarn-site.xml的

overfit同步小助手 2023-03-29 10:04:23 0 收藏

C++ CreateFileMapping 内存映射实现快速读取文件

共享内存的方式原理就是将一份物理内存映射到不同进程各自的虚拟地址空间上，这样每个进程都可以读取同一份数据，从而实现进程通信。因为是通过内存操作实现通信，因此是一种最高效的数据交换方法。本文主要讲述的使用内存映射文件的目的是访问磁盘上的数据文件。你可以不必对文件执行I / O操作，并且可以不必对文件内

overfit同步小助手 2023-03-29 10:04:19 0 收藏

hadoop启动后,集群里没有NodeManager

解决方案：cd /opt/module/hadoop-3.1.3/etc/hadoop/vim yarn-site.xml<property> <name>yarn.nodemanager.resource.memory-mb</name> <v

overfit同步小助手 2023-03-29 10:04:10 0 收藏

安装Hadoop集群（超详细！）

前面我写了一篇单机版的Hadoop安装，这里终于要装集群版，装集群版的步骤比较繁琐，需要同学们多加练习，因为我们不可能只装一次，经常出了问题就要重装，所以必须要练熟练。

overfit同步小助手 2023-03-29 10:04:05 0 收藏

Elasticsearch 8集群搭建、安全功能配置详述

本文主要记录Elasticsearch 8.4.3的安装过程，一方面是记录如何搭建一个Elasticsearch 8 集群，另外一方面是通过安装过程，了解在这个过程中Elasticsearch在背后做了一些什么，有助于我们理解Elasticsearch的启动和集群搭建流程。

overfit同步小助手 2023-03-29 09:05:30 0 收藏

大数据之Hive：space函数

1、空格字符串函数：space语法: space(int n)返回值: string说明：返回长度为n的空格字符串举例：hive> select space(10) from dual;hive> select length(space(10)) from dual;102、space函

overfit同步小助手 2023-03-29 09:05:24 0 收藏

大数据DataX（六）：MySQL导入到HBase

简而言之，HbaseWriter 通过 HBase 的 Java 客户端，通过 HTable，Put等 API，将从上游Reader读取的数据写入HBase你hbase11xwriter与hbase094xwriter的主要不同在于API的调用不同，Hbase1.1.x废弃了很多Hbase0.94.

overfit同步小助手 2023-03-29 09:05:10 0 收藏

Hadoop安全之Kerberos

overfit同步小助手 2023-03-29 08:10:16 0 收藏

为什么美国加息，会让硅谷银行破产？美联储为什么要加息？

问：为什么美国加息，会导致银行购买的国债资产减值？问：为什么美国加息会导致国债利率上升？能否再具体讲一下？问：能用数字说明一下吗？问：美联储为什么要加息？问：能否使用数字加以说明？

overfit同步小助手 2023-03-29 08:05:19 0 收藏

Java网络编程——客户端Socket

目录第一部分：使用Socket一.数据报二.socket的功能第二部分：了解SOCKET类1.socket类2.构造方法3.常用方法介绍4.DEMO:客户端和服务端通信第三部分：用Telnet研究协议一、了解Telnet二、用Socket从服务器读取1.在终端上用Telnet测试daytime服务器

overfit同步小助手 2023-03-29 08:05:14 0 收藏

【Flink 实战系列】Flink CDC 实时同步 Mysql 全量加增量数据到 Hudi

Flink CDC 是基于 Flink 开发的变化数据获取组件（Change data capture），简单的说就是来捕获变更的数据，Apache Hudi 是一个数据湖平台，又支持对数据做增删改查操作，所以 Flink CDC 可以很好的和 Hudi 结合起来，打造实时数仓，实时湖仓一体的架构，

overfit同步小助手 2023-03-29 08:05:08 0 收藏

【HDFS】权限管理

一文带你了解HDFS的权限管理~~~

overfit同步小助手 2023-03-29 08:05:05 0 收藏