大数据 - overfit.cn

【ElasticSearch】（五）—— DSL查询文档

目录1）DSL查询分类2）全文检索查询1、使用场景2、基本语法3、示例4、总结3）精准查询1、term 查询2、range查询3、总结4）地理坐标查询1、矩形范围查询2、附近查询5）复合查询1、相关性算分2、算分函数查询3、布尔查询elasticsearch的查询依然是基于JSON风格的DSL来实现

overfit同步小助手 2022-05-21 07:05:24 0 收藏

【kafka专栏】生产级集群安装主机之间ssh免密登录

为了保证一台Linux主机的安全，每个主机登录的时候都需要账号密码。但是很多时候为了操作方便，需要设置集群互信主机之间的SSH免密码登录。

overfit同步小助手 2022-05-21 07:05:21 0 收藏

SpringBoot整合Elasticsearch开发

SpringBoot整合elasticsearch能够快速的进行Elasticsearch开发,利用SpringBoot的自动注入，大大提升了Java开发的效率

overfit同步小助手 2022-05-21 07:05:18 0 收藏

Spring Boot 2.7.0发布，2.5停止维护，节奏太快了吧

这几天是Spring版本日，很多Spring工件都发布了新版本， Spring Framework 6.0.0 发布了第 4 个里程碑版本，此版本包含所有针对 5.3.20 的修复补丁，以及特定于 6.0 分支的 39 项修复和改进。而今天Spring Boot 2.7.0和Spring Secur

overfit同步小助手 2022-05-21 07:05:15 0 收藏

Hadoop之实战WordCount

大致流程如下：第一步：开发Map阶段代码第二步：开发Reduce阶段代码第三步：组装Job在idea中创建WordCountJob类添加注释，梳理一下需求：需求：读取hdfs上的hello.txt文件，计算文件中每个单词出现的总次数hello.txt文件内容如下：hello youhello me最

overfit同步小助手 2022-05-20 07:47:48 0 收藏

熟悉常用的HBase操作

HBase是一个分布式的、面向列的开源数据库,源于Google的一篇论文《BigTable：一个结构化数据的分布式存储系统》。HBase以表的形式存储数据，表有行和列组成，列划分为若干个列族/列簇(column family)。欲了解HBase的官方资讯，请访问[HBase官方网站](http://

overfit同步小助手 2022-05-20 07:47:44 0 收藏

home credit default risk（捷信违约风险）机器学习模型复现(论文_毕业设计_作业)

overfit同步小助手 2022-05-20 07:47:41 0 收藏

HBase几种安装方式

HBase几种安装方式一、前提说明二、具体安装步骤一、前提说明Hadoop已经完成安装（如伪分布式、全分布式等）zookeeper已经完成安装（全分布式和HA模式需要）环境对应关系如下：hbase环境对应hadoop环境对应外部zookeeper环境本地模式不需要不需要伪分布式伪分布式单机安装（也可

overfit同步小助手 2022-05-20 07:47:34 0 收藏

Rasa 3.x 学习系列-Rasa 3.1+ ElasticSearch 8.2.0 对话机器人实战六

ElasticSearch 导入Rasa电影案例数据基于 ElasticSearch的Rasa智能对话机器人开发Rasa 3.1.0 KnowledgeBase 源代码分析基于 ElasticSearch的Rasa 对话互动场景Rasa对话机器人和用户打招呼Rasa对话机器人协助用户查询电影Rasa

overfit同步小助手 2022-05-20 07:47:28 0 收藏

网络安全----数据库1

网络安全

overfit同步小助手 2022-05-20 07:47:24 0 收藏

windows定时任务准点运行kettle转换、作业等

kettle定时作业任务，时间间隔几十分钟跑一次时，将不会在你设置的时间准时启动？此文章教程将教你利用Windows自带cmd命令和定时任务计划功能，准时准点启动，毫秒不差，适合有准点运行需求的，教程内容简单易懂，此方法适合初级秃头学习使用

overfit同步小助手 2022-05-20 07:47:18 0 收藏

【BigData】Scala语言的简要介绍以及在window下安装Scala

Spark是专为大规模数据处理而设计的快速通用的计算引擎,它是用Scala语言开发实现的。大数据技术本身就是数据计算的技术,而Scala既有面向对象组织项目工程的能力，又具备计算数据的功能,同时与Spark 紧密集成。一、Scala概述Scala于2001年由瑞士洛桑联邦理工学院(EPFL)编程方法

overfit同步小助手 2022-05-19 11:46:58 0 收藏

pandas---数据处理

数据预处理1. DataFrame常用操作1.1 DataFrame去除空行（1）对于一般空行（2）对于列表式（list）空行1.2 数据的前期处理（1）DataFrame获取某一列的数据并去重（2）表格中填充01.3 数据的获取及筛选（1）获取某一行某一列的数据值（2）以某一列为比较条件的所有行

overfit同步小助手 2022-05-19 11:46:54 0 收藏

我们如何在代码中实现主从的选择-Java

问题描述：我们在分布式任务系统之中，会经常遇见一种情况，比如：定时的对任务进行刷新，然后进行一些操作。通常我们会将这个定时任我Job单独部署成一个服务，这个服务如果我们不进行主选择，便会出现多个服务同时进行刷新，造成业务的紊乱。解决方案：使用Zookeeper来进行主的选择1、添加对应的依赖<

overfit同步小助手 2022-05-19 11:46:49 0 收藏

ubuntu上配置好hadoop后，运行MapReduce

ubuntu上配置好hadoop环境后，运行官网MapReduce教程。

overfit同步小助手 2022-05-19 10:47:23 0 收藏

【2022年】浙江省专升本数学全面总结-(无穷级数)

本人是2022年考生，思维导图是一点一点收集起来的，分别从2011～2021真题卷题型为主以同济大学的绿皮书为基础收集，以文亮、精通、点对点等机构的押题为辅，并且以考过的各个知识点进行合理的雪花式拓展进行全面总结

overfit同步小助手 2022-05-19 10:47:20 0 收藏

【2022年】浙江省专升本数学全面总结-(空间解析几何与向量代数)

本人是2022年考生，思维导图是一点一点收集起来的，分别从2011～2021真题卷题型为主以同济大学的绿皮书为基础收集，以文亮、精通、点对点等机构的押题为辅，并且以考过的各个知识点进行合理的雪花式拓展进行全面总结，本文讲的是第六章节-(空间解析几何与向量代数)

overfit同步小助手 2022-05-19 10:47:16 0 收藏

【2022年】浙江省专升本数学全面总结-(一元函数微分学)

本人是2022年考生，思维导图是一点一点收集起来的，分别从2011～2021真题卷题型为主以同济大学的绿皮书为基础收集，以文亮、精通、点对点等机构的押题为辅，并且以考过的各个知识点进行合理的雪花式拓展进行全面总结，本文讲的是第二章节-(一元函数微分学)

overfit同步小助手 2022-05-19 10:47:13 0 收藏

摆平各类目标检测识别AI应用，有它就够了

在计算机视觉领域，CANN最新开源的通用目标检测与识别样例，通过其强大的可定制、可扩展性，为AI开发者们提供了良好编程选择。

overfit同步小助手 2022-05-18 08:13:42 0 收藏

消息队列-kafka关于CommitFailedException问题

说明：转载本人掘金文章概述提交offset失败这个异常也是我们开发中常见的异常，那么这个异常是怎么引起的呢？只要我们明白原因，那么就能避免，特别是在异步提交情况下（offset丢失），导致重复消费，消息一直卡在最后一批，导致业务数据受到严重的破坏。了解消费者实例机制1.kafka消费者都是按照批量消

overfit同步小助手 2022-05-18 08:13:34 0 收藏