大数据 - overfit.cn

hdfs分布式文件系统默认数据存放路径、及相关配置属性详细解析

b.复制{/tmp/hadoop-hyxy/dfs/name}至{/home/hyxy/tmp/hadoop/dfs}的路径下，问题解决。失败的原因是：我们在core-site.xml修改了tmp路径：【/home/hyxy/tmp/hadoop】，启动namenode服务的时候，系统找不到原来的路

overfit同步小助手 2023-03-29 02:06:12 0 收藏

大数据生态中的 RocketMQ 5.0

随着RocketMQ 5.0的发布，RocketMQ 在处理消息、事件和流上实现了统一，有了越来越强大的优势，存储和计算分离的特性也使其能提供更低的成本，使企业上云更省钱、更省力，也更省人力。

overfit同步小助手 2023-03-29 02:06:09 0 收藏

Hadoop

Hadoop Distributed File System，简称 HDFS，是一个分布式文件系统。NameNode（nn）：存储文件的。

overfit同步小助手 2023-03-29 02:05:40 0 收藏

Java语言链接MongoDB常用的方法

MongoDB官方提供了Java和Python语言的驱动包，利用这些驱动包可使用多种编程方法来连接并操作MongoDB数据库。本节将介绍如何设置和使用MongoDBJDBC驱动程序，通过JDBC实现与MongoDB服务端的通信功能，用户可以在此基础上进行各种Java程序的开发。MongoDB作为一种

overfit同步小助手 2023-03-29 02:05:28 0 收藏

联邦学习隐私保护相关知识总结

针对隐私保护的法律法规相继出台，数据孤岛现象已成为阻碍大数据和人工智能技术发展的主要瓶颈，联邦学习作为隐私计算的重要技术被广泛关注，主要对联邦学习相关知识进行了总结

overfit同步小助手 2023-03-29 02:05:19 0 收藏

搭建hadoop高可用集群（二）

overfit同步小助手 2023-03-29 02:05:09 0 收藏

融资约束指数：SA、KZ、WW （1999至2020年）

overfit同步小助手 2023-03-29 02:05:02 0 收藏

系统架构设计——互联网金融架构设计

根据第三方机构预统计，自2016年-2019年，我国零售信贷规模维持20%以上的高复合增长率，2017年中国零售信贷规模达到27万亿，到2019年，总规模超过37万亿。近年来互联网金融蓬勃发展，在借贷、保险、股权等领域涌现出一大批互联网与金融场景相结合的创新产品。同时作为互联网金融的子领域消费金融领

overfit同步小助手 2023-03-29 02:04:57 0 收藏

SLA是什么？

写在前面本文隶属于专栏《100个问题搞定大数据理论体系》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和文献引用请见100个问题搞定大数据理论体系解答SLA( Service- Level Agreement)，也就是服务等级协议，指的是系統服务提供者(

overfit同步小助手 2023-03-29 02:02:46 0 收藏

CUDA的卸载（v10.0）与安装（v10.2）

CUDA的安装与卸载

overfit同步小助手 2023-03-29 02:02:16 0 收藏

用结构化思维吃透MySQL面试题——再也不怕连环问

MySQL基础知识的掌握是必须要会的，比如：create、insert、update、delete、select、drop、alter、show等。这些在企业生产当中会经常使用；存储引擎主要是针对数据库脚本进行解析、分析、优化和执行、索引、及数据结构；在关系型数据库中，事务的重要性不言而喻，事务具有

overfit同步小助手 2023-03-29 01:05:10 0 收藏

GIN：图同构网络

论文标题：How Powerful are Graph Neural Networks?论文链接：https://arxiv.org/abs/1810.00826论文来源：ICLR 2019一、概述目前的GNN框架大多遵循递归邻域聚合（或者消息传递）框架，并且已经出现各种GNN变种。然而，新的GNN

overfit同步小助手 2023-03-29 01:05:01 0 收藏

Elasticsearch： Prefix queries - 前缀查询

Prefix 查询被用于在查询时返回在提供的字段中包含特定前缀的文档。有时我们可能想使用前缀查询单词，例如 Leonardo 的 Leo 或 Marlon Brando、Mark Hamill 或 Martin Balsam 的 Mar。Elasticsearch 提供了一个前缀查询，用于获取匹配单

overfit同步小助手 2023-03-29 01:04:58 0 收藏

【Flink系列】窗口系列简介

overfit同步小助手 2023-03-29 01:04:49 0 收藏

大数据开发是做什么的？怎样入门？

我们现在正处于“互联网+”的时代，将互联网和传统行业融合，往往可以创造出1+1＞2的效果。这种1+1的模式，在编程语言的使用上也通用，比如Python+大数据开发，就可以在数字化经济中发挥巨大作用。目前，数字经济成为全球经济增长新动能，而我国的数字经济规模在世界上排行第二！从以量级计算的数据中找到背

overfit同步小助手 2023-03-29 01:04:43 0 收藏

mysql 亿级数据表查询

mysql近3亿数据的表里面查询统计一个月的数据。

overfit同步小助手 2023-03-29 01:04:38 0 收藏

es的配置文件（elasticsearch.yml）

设置为true来锁住内存。gateway的类型，默认为local即为本地文件系统，可以设置为本地文件系统，分布式文件系统，hadoop的HDFS，和amazon的s3服务器，其它文件系统的设置方法下次再详细说。配置es的集群名称，默认是elasticsearch，es会自动发现在同一网段下的es，如

overfit同步小助手 2023-03-29 01:04:35 0 收藏

什么是数据埋点？有何作用？

数据埋点是指基于业务需求(如淘宝双 11 促销页面统计每个 banner 的点击次数)、产品需求(如推荐系统统计推荐商品的曝光次数及点击人数)，对每一个用户行为事件对应的位置进行埋点，并通过 SDK 上报埋点的数据结果，将记录数据汇总后进行分析，以推动产品优化或指导运营。

overfit同步小助手 2023-03-29 01:04:27 0 收藏

【Flink】解析参数之ParameterTool

在我们平时写程序的时候，会把很多参数提出来在命令行输入或者配置文件中读取，Flink源码中提供了解析多数据源（命令行、配置文件）的解析类ParameterTool，我们常用的就是命令行、配置文件这两种方式，省去我们自己写解析的逻辑，下面我们看下怎么使用ParameterTool

overfit同步小助手 2023-03-29 01:04:23 0 收藏

Ubuntu下的Hadoop安装

overfit同步小助手 2023-03-29 01:04:20 0 收藏