大数据 - overfit.cn

大数据系列之：安装pulsar详细步骤

overfit同步小助手 2023-04-06 15:04:26 0 收藏

详解clickhouse分区目录的合并过程

BlockNum 是一个整型的自增长型编号，该编号在单张MergeTree表中从1开始全局累加，当有新的分区目录创建后，该值就加1，对新的分区目录来讲，MinBlockNum 和 MaxBlockNum 取值相同。MergeTree的分区目录并不是在数据表被创建之后就存在的，而是在数据写入过程中被创

overfit同步小助手 2023-04-06 15:04:14 0 收藏

【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解（图文解释）

overfit同步小助手 2023-04-06 14:05:04 0 收藏

spark on yarn 的执行过程以及日志分析

overfit同步小助手 2023-04-06 14:04:57 0 收藏

Landsat Collection 2 数据集详细介绍（T1/T2产品差异）

第 2 层场景遵循与第 1 层场景相同的辐射标准，但不符合第 1 层几何规范，因为轨道信息不太准确（特定于旧的 Landsat 传感器） )、明显的云层覆盖、地面控制不足或其他因素。第 1 层包括 1 级精度和地形 (L1TP) 校正数据，这些数据具有良好的辐射特性，并在不同的 Landsat 仪器

overfit同步小助手 2023-04-06 14:04:52 0 收藏

【AI智能写作】怎样写一篇高质量热门火爆的技术文章？

怎样写出一篇高质量的文章？写一篇高质量热门火爆的技术文章需要以下几个步骤：找到您感兴趣的话题：选择一个您感兴趣的话题，这样您就会更有动力和热情地写作。同时，您也需要确保您选择的话题是热门和具有吸引力的，以吸引更多的读者。选择一个热门话题：选择一个人们正在关注的技术话题，并确保您的文章提供有价值的信息

overfit同步小助手 2023-04-06 14:04:46 0 收藏

MobPush，免费的APP消息推送系统

MobPush可以满足从拉新、促活到唤醒、召回、A/B测试各种运营场景，对于APP在整个生命周期的所有运营需求，基本上都能够满足，并且在实现消息推送时，还支持通知、透传、本地消息及富媒体多种消息类型，方便运营者灵活选择。目前，MobPush是Mob推出来的一款免费消息推送工具，目前市场上很多第三方工

overfit同步小助手 2023-04-06 13:04:57 0 收藏

PySpark集群完全分布式搭建

本文的目的是使读者对spark的安装流程有一个清晰的认识，并且能根据本文的内容搭建一个属于自己的完全分布式Spark集群，并在此基础上增加pyspark的分布式环境。

overfit同步小助手 2023-04-06 13:04:31 0 收藏

华为数字化转型之道实践篇第九章数字化运营：实现业务运营模式升级

业务运营是为了帮助企业基于自身业务战略，更好地达成企业经营与运营目标，这中间包含业务沿着流程周而复始地运转，以及在作业过程中识别并推动问题解决等过程。而，如图9-1所示。一方面，数字化运营成为各个企业数字化转型的必经之路，如果缺失，似乎就意味着企业的数字化转型是不完整的另一方面，我们也能够看到，数字

overfit同步小助手 2023-04-06 13:04:16 0 收藏

yolov5 +cuda10.2 +gpu环境搭建（详细版本）

YOLOv5是一种单阶段目标检测算法，该算法在YOLOv4的基础上添加了一些新的改进思路，使其速度与精度都得到了极大的性能提升。主要的改进思路如下所示：输入端：在模型训练阶段，提出了一些改进思路，主要包括Mosaic数据增强、自适应锚框计算、自适应图片缩放；基准网络：融合其它检测算法中的一些新思路，

overfit同步小助手 2023-04-06 13:03:50 0 收藏

量化策略——准备3 数据、Backtrader回测框架与quantstats评价指标

我们一般使用这个库来获取股票数据或策略中用得到的数据：使用Backtrader框架作为回测的框架：使用quantstats库作为回测结果评价的库：这一部分准备好之后，后续我们将关注点主要放在【策略】上，对于数据、评价指标这些如无特殊处理，将不再赘述。整个量化的框架构造起来不太容易，如果以前有所了解，

overfit同步小助手 2023-04-06 12:04:11 0 收藏

大数据周会-本周学习内容总结07

overfit同步小助手 2023-04-06 12:04:02 0 收藏

docker安装elasticsearch kibana 8.6.0(设置密码+汉化+ik分词器)

docker安装es kibana 8.6.0es8es8.6.0elasticsearch8elasticsearch8.6.0es汉化ik分词器ikik8.6.0ik8

overfit同步小助手 2023-04-06 11:04:42 0 收藏

《辉煌优配》“券茅”跳水大跌6%，昨日多次宕机！富豪瑞士销户取钱涌入香...

陈述期内，公司多措并重，深挖工商业客户用气需求，完成天然气供应量43.08亿立方米，同比增加6%，一起，公司积极拓展天然气事务，不断推动石油化工产品、光伏等其他动力领域的布局，完成了其他动力供应板块经运营绩的稳步增加。公司昨夜发布的2022年年报显现，2022年公司完成运营收入约35.39亿元，同比

overfit同步小助手 2023-04-06 11:04:34 0 收藏

Spark SQL之空值Null,NaN判断和处理

Spark SQL空值Null,NaN判断和处理drop,fill,filter.coalease,replace,nullif,nvl

overfit同步小助手 2023-04-06 11:04:03 0 收藏

大数据知识图谱项目——基于知识图谱的医疗知识问答系统（详细讲解及源码）

本项目基于医疗方面知识的问答，通过搭建一个医疗领域知识图谱，并以该知识图谱完成自动问答与分析服务。本项目以neo4j作为存储，基于传统规则的方式完成了知识问答，并最终以关键词执行cypher查询，并返回相应结果查询语句作为问答。问答系统完全基于规则匹配实现，通过关键词匹配，对问句进行分类，医疗问题本

overfit同步小助手 2023-04-06 10:04:32 0 收藏

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文，企业科研

overfit同步小助手 2023-04-06 10:04:20 0 收藏

Hadoop分布式集群搭建完整版（持续更新中）

Hadoop集群的搭建，从零到一

overfit同步小助手 2023-04-06 10:04:12 0 收藏

hadoop启动集群之后没有namenode的一种情况

先说结论吧，一般在网上搜索这个问题都是让重新格式化namenode(当然，格式化之前要记得清空namenode和DataNode文件夹)。但是对于我之前遇到的问题却没法解决。我的做法是：检查你的hadoop的配置文件是否填写正确，我的hadoop的hdfs-site.xml中的主机IP地址未填写正确

overfit同步小助手 2023-04-06 10:04:09 0 收藏

ElasticSearch 索引创建

创建索引是使用Elasticsearch的关键步骤之一。在创建索引时，您需要考虑字段类型、分析器、嵌套和多个映射等因素。您还可以使用别名、分片和副本等功能来提高系统的容错性、性能和可用性。在创建索引之前，请确保您已经安装了Elasticsearch并启动了服务器。您还需要使用适当的REST客户端与服

overfit同步小助手 2023-04-06 10:03:55 0 收藏