大数据 - overfit.cn

Elasticsearch：通过 JDBC 使用 SQL 来查询索引 - DBeaver

Elasticsearch 的 SQL 访问层能够通过两种最常用的数据库管理系统 (DBMS) 协议提供数据访问，Java 数据库连接 (JDBC) 和开放数据库连接 (ODBC)。这些驱动程序可以安装在客户端应用程序中，以便轻松地将 Elasticsearch 与最流行的工具集成，例如：DBea

overfit同步小助手 2022-08-01 10:26:14 0 收藏

Hadoop——Hadoop优势、组成、大数据技术生态体系、系统框架图

HadoopDistributedFileSystem，简称HDFS，是一个分布式文件系统。存储文件的元数据，如文件名，文件目录结构，文件属性（生成时间、副本数、文件权限），以及每个文件的块列表和块所在的DataNode等。在本地文件系统存储文件块数据，以及块数据的校验和。每隔一段时间对NameNo

overfit同步小助手 2022-08-01 10:26:05 0 收藏

指令集数据产品如何设计和实现报表协同系统——基于指令集物联网操作系统的工业协同制造项目开发实践

指令集物联网操作系统在数据填报、流程管理、数据处理、报表四个方向都打磨了对应的数据产品，实现分钟级表单搭建、多源数据快速接入、报表在线设计。

overfit同步小助手 2022-07-31 08:56:03 0 收藏

ELK部署脚本---亲测可用

注意事项部分扩展需要连接gethub网站，你懂的，可能导致部分插件安装失败，可以在脚本执行中跳过，待网络良好时再安装。elasticsearch-node1脚本（脚本运行中会提示你输入部分信息如IP，日志文件路径以及日志文件类型等）提示"请输入您要监控的本机日志文件类型(对应ES索引）"system

overfit同步小助手 2022-07-31 08:55:59 0 收藏

Hadoop运行环境搭建（开发重点）、VMware 安装

推荐的软件为VMware，VMware可以使用户在一台计算机上同时运行多个操作系统，还可以像Windows应用程序一样来回切换。用户可以如同操作真实安装的系统一样操作虚拟机系统，甚至可以在一台计算机上将几个虚拟机系统连接为一个局域网或者连接到互联网。一台电脑本身是可以装多个操作系统的，但是做不到多个

overfit同步小助手 2022-07-31 08:55:54 0 收藏

【SpringBoot实战系列】RabbitMQ实现消息发送并实现邮箱发送异常监控报警实战

RabbitMQ邮箱发送邮件发送

overfit同步小助手 2022-07-31 08:55:42 0 收藏

从校园到职场，如果是你会和我一样吗？

关于离开校园后步入职场这个过程，原本早就想写一写的，但大概是半年多时间来心理总是有些浮躁，就没有清晰的回顾过，没有别的特别原因，打完球一个人呆在小单间里，还是通过文字小小总结一下从校园到社会这个阶段的一些经历和体会。.........

overfit同步小助手 2022-07-31 08:55:37 0 收藏

后缀自动机（SAM）讲解 + Luogu p3804【模板】后缀自动机 (SAM)

后缀自动机 SAM

overfit同步小助手 2022-07-30 07:56:39 0 收藏

python借助pandas处理大数据中的csv.

该文主要是python利用pandas对csv数据的处理,主要用于数学建模的大数据分析与挖掘,和一些大数据分析与挖掘比赛,本文主要针对对csv大数据的读取,对数据的处理:获取csv数据的某行,csv数据的某几行,csv数据的某列.处理某列数据的重复值,合并单元格,把需要的数据合并在一起.......

overfit同步小助手 2022-07-30 07:56:32 0 收藏

elasticsearch更新某条数据的某个字段为空（null）

MarkdownText-to-HTMLAuthorsJohnLuke。

overfit同步小助手 2022-07-30 07:56:29 0 收藏

CDH/CDP 是什么？

CDH （ Cloudera Distribution Hadoop ）是 Cloudera 公司提供的包含 Apache Hadoop 及其相关项目的软件发行版本。CDP（Cloudera Data Platform）是 CDH 的继任者。CDP 是面向企业的云计算平台。

overfit同步小助手 2022-07-30 07:56:25 0 收藏

【面经】米哈游数据开发面经

面经

overfit同步小助手 2022-07-30 07:56:22 0 收藏

【分析BMI指数~python】

运行效果如下：运行效果如下：欢迎关注微信公众号【程序人生6】，一起探讨学习哦！！！

overfit同步小助手 2022-07-30 07:56:18 0 收藏

记一次flink standalone模式下偶现Metaspace OOM的问题

overfit同步小助手 2022-07-29 09:42:22 0 收藏

【SQL解析】- Druid SQL AST 01

Druid SQL ASTSQL编译器SQL语法树

overfit同步小助手 2022-07-29 09:42:19 0 收藏

8000字讲透OBSA原理与应用实践

OBSA项目是围绕OBS建立的大数据和AI生态，其在不断的发展和完善中，目前有如下子项目：hadoop-obs项目和flink-obs项目。

overfit同步小助手 2022-07-29 09:42:16 0 收藏

时间如水，东流而逝！Python中的异步，定时任务（Celery，Apscheduler）

APScheduler和Celery---项目实战使用方法介绍

overfit同步小助手 2022-07-29 09:42:12 0 收藏

迁徙数据平台简单介绍

人口迁徙数据是研究人口流动、人口迁徙以及城市发展的重要数据源。近年来，受新冠肺炎疫情影响，以及互联网的快速发展，相关数据受到广泛关注与应用，以人口迁徙数据为基础的科学研究也层出不穷。平台给出了指定城市的迁出和迁入数据，并计算出汽车、火车、飞机三种交通方式的迁徙热度（迁徙热度代表该条线路人群流动的热度

overfit同步小助手 2022-07-29 09:42:06 0 收藏

Apache Fink 文件上传漏洞复现及利用

其它不修改，然后点击发送，因为该版本的ApacheFlink中存在有一个目录穿越漏洞，详细内容在。一个数据包，数据包中的文件，右键点击重发，然后可以看到数据包中内容。应该就是文件的名称，其创建文件的路径猜测是其默认文件路径的。boundary是分隔符，不用关注，查看到其。处进行检查或者强制规定的路径

overfit同步小助手 2022-07-29 09:42:00 0 收藏

大厂面试官眼中的好简历到底长啥样

小小简历，大大天地，如何将简历写到面试官心坎里。

overfit同步小助手 2022-07-29 09:41:54 0 收藏