大数据 - overfit.cn

GIN：图同构网络

论文标题：How Powerful are Graph Neural Networks?论文链接：https://arxiv.org/abs/1810.00826论文来源：ICLR 2019一、概述目前的GNN框架大多遵循递归邻域聚合（或者消息传递）框架，并且已经出现各种GNN变种。然而，新的GNN

overfit同步小助手 2023-03-29 01:05:01 0 收藏

Elasticsearch： Prefix queries - 前缀查询

Prefix 查询被用于在查询时返回在提供的字段中包含特定前缀的文档。有时我们可能想使用前缀查询单词，例如 Leonardo 的 Leo 或 Marlon Brando、Mark Hamill 或 Martin Balsam 的 Mar。Elasticsearch 提供了一个前缀查询，用于获取匹配单

overfit同步小助手 2023-03-29 01:04:58 0 收藏

kafka 中参数：session.timeout.ms 和 heartbeat.interval.ms的区别

文章目录1、heartbeat.interval.ms2、heartbeat.interval.ms 与 session.timeout.ms 的对比3、session.timeout.ms 和 max.poll.interval.ms4、一次kafka consumer 不断地 rebalance

overfit同步小助手 2023-03-29 01:04:55 0 收藏

数据分析Power BI案例：产品与客户销售数据分析

本节课我们以产品与销售数据表.xlsx文件作为数据源，实现一个简单的Power BI项目打开Power BI Desktop，从登录界面或文件选项选择“获取数据”，选择从“Excel”导入，点击连接，找到产品与销售数据表.xlsx文件并打开。选中两个sheet表，然后点击加载数据。ctrl+s保存为

overfit同步小助手 2023-03-29 01:04:52 0 收藏

【Flink系列】窗口系列简介

overfit同步小助手 2023-03-29 01:04:49 0 收藏

基于docker的hadoop集群搭建

最近想学习如何使用hdfs来存储文件，在网上学习了一下，明确了HDFS（Hadoop Distribute File System 分布式存储）、mapReduce（分布式计算）、YARN（Yet Another Resource Negotiator资源管理）是hadoop的三大组成部分，要想使用

overfit同步小助手 2023-03-29 01:04:46 0 收藏

大数据开发是做什么的？怎样入门？

我们现在正处于“互联网+”的时代，将互联网和传统行业融合，往往可以创造出1+1＞2的效果。这种1+1的模式，在编程语言的使用上也通用，比如Python+大数据开发，就可以在数字化经济中发挥巨大作用。目前，数字经济成为全球经济增长新动能，而我国的数字经济规模在世界上排行第二！从以量级计算的数据中找到背

overfit同步小助手 2023-03-29 01:04:43 0 收藏

Linux中Docker安装RabbitMQ

1.介绍是一套开源（MPL）的服务软件，是由 LShift 提供的一个 Advanced Message Queuing Protocol (AMQP) 的开源实现，由以高性能、健壮以及可伸缩性出名的 Erlang 写成。2. MQ介绍MQ是一个互联网架构中常见的利器。什么时候不使用MQ？上游实时关

overfit同步小助手 2023-03-29 01:04:40 0 收藏

mysql 亿级数据表查询

mysql近3亿数据的表里面查询统计一个月的数据。

overfit同步小助手 2023-03-29 01:04:38 0 收藏

es的配置文件（elasticsearch.yml）

设置为true来锁住内存。gateway的类型，默认为local即为本地文件系统，可以设置为本地文件系统，分布式文件系统，hadoop的HDFS，和amazon的s3服务器，其它文件系统的设置方法下次再详细说。配置es的集群名称，默认是elasticsearch，es会自动发现在同一网段下的es，如

overfit同步小助手 2023-03-29 01:04:35 0 收藏

RabbitMQ消息队列实战（2）—— Java调用RabbitMQ的三种方式

spring cloud stream的强大之处就在于它的封装，但是不足之处也在于它的封装，封装的太强，必然增加了学习成本和调试难度，而且类似RabbitMQ和Kafka这种中间件的使用，一般在系统创建之处就一定确定，进行无缝切换就显得有些鸡肋了。第5个参数是队列的一些结构化信息，比如声明死信队列、

overfit同步小助手 2023-03-29 01:04:30 0 收藏

什么是数据埋点？有何作用？

数据埋点是指基于业务需求(如淘宝双 11 促销页面统计每个 banner 的点击次数)、产品需求(如推荐系统统计推荐商品的曝光次数及点击人数)，对每一个用户行为事件对应的位置进行埋点，并通过 SDK 上报埋点的数据结果，将记录数据汇总后进行分析，以推动产品优化或指导运营。

overfit同步小助手 2023-03-29 01:04:27 0 收藏

【Flink】解析参数之ParameterTool

在我们平时写程序的时候，会把很多参数提出来在命令行输入或者配置文件中读取，Flink源码中提供了解析多数据源（命令行、配置文件）的解析类ParameterTool，我们常用的就是命令行、配置文件这两种方式，省去我们自己写解析的逻辑，下面我们看下怎么使用ParameterTool

overfit同步小助手 2023-03-29 01:04:23 0 收藏

Ubuntu下的Hadoop安装

overfit同步小助手 2023-03-29 01:04:20 0 收藏

2023大数据必看面试题

大数据必看面试题

overfit同步小助手 2023-03-29 00:05:01 0 收藏

RabbitMQ与MQTT区别

overfit同步小助手 2023-03-29 00:04:58 0 收藏

【数据挖掘实战】——航空公司客户价值分析（K-Means聚类案例）

在企业的客户关系管理中，对客户分类，区分不同价值的客户。针对不同价值的客户提供个性化服务方案，采取不同营销策略，将有限营销资源集中于高价值客户，实现企业利润最大化目标。在竞争激烈的航空市场里，很多航空公司都推出了优惠的营销方式来吸引更多的客户。在此种环境下，如何将公司有限的资源充分利用，提示企业竞争

overfit同步小助手 2023-03-29 00:04:53 0 收藏

基于注意力时空图神经网络的交通预测

文章信息本周阅读的论文是题目为《Learning Dynamics and Heterogeneity of Spatial-Temporal Graph Data for Traffic Forecasting》的一篇2021年发表在《IEEE Transactions on Knowledge

overfit同步小助手 2023-03-29 00:04:50 0 收藏

MySQL数据库的数据类型和基于MySQL数据类型的综合实例项目

数值型数据类型主要用来存储数字。MySQL的整数类型如下所示TINYINT、SMALLINT、MEDIUMINT、INT(INTEGER）、 BIGINT。创建表tmp1，其中字段x、y、z、m、n数据类型依次为TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT，SQL语句如

overfit同步小助手 2023-03-29 00:04:47 0 收藏

【云原生】Minio on k8s 讲解与实战操作

MinIO 是在 GNU Affero 通用公共许可证 v3.0 下发布的高性能对象存储。它与 Amazon S3 云存储服务 API 兼容。使用 MinIO 为机器学习、分析和应用程序数据工作负载构建高性能基础架构。高性能分布式对象存储——MinIO（环境部署）高性能分布式对象存储——MinIO实

overfit同步小助手 2023-03-29 00:04:44 0 收藏