大数据 - overfit.cn

Doris全方位教程+应用实例

hll 列类型，不需要指定长度和默认值、长度根据数据的聚合程度系统内控制，并且 HLL 列只能通过配套的 hll_union_agg 、 Hll_cardinality、hll_hash 进行查询或使用。缺点：这两种对hbase支持的都不好，presto 不支持，但是对hdfs、hive兼容性很

overfit同步小助手 2024-08-22 09:04:04 0 收藏

基于python+大数据爬虫技术+数据可视化+Spark的电力能耗数据分析与可视化平台设计与实现

随着经济的发展和人口的增加，能源消耗也在不断增加。电力作为人们生产和生活中不可或缺的一部分，对于能源消耗的贡献也非常大。传统的电力供应模式已经无法满足人们对电力的需求，同时也带来了环境污染等问题。如何优化电力供应模式，提高能源利用效率，成为了当前亟待解决的问题。而电力能耗数据分析正是解决这一问题的有

overfit同步小助手 2024-08-22 09:03:21 0 收藏

农产品S2B2C商城解决方案：新疆农产新零售

软道S2B2C商城平台，成功助力新疆农户拓宽销售渠道、提升产品附加值，同时降低采购成本、增强食品安全保障，推动新疆农产品产业升级。在辽阔的新疆大地上，孕育着无数令人垂涎的优质农产品，但由于农产品流通体系尚不完善，物流成本高企；农产品品牌化、标准化程度有待提高；为果安奇量身定制了一套S2B2C商城系统

overfit同步小助手 2024-08-22 08:04:05 0 收藏

三十种未授权访问漏洞复现合集（四）

JBoss是一个基于J2EE的开放源代码应用服务器，代码遵循LGPL许可，可以在任何商业应用中免费使用;JBoss也是一个管理EJB的容器和服务器，支持EJB 1.1、EJB 2.0和EJB3规范。,默认情况下访问 http://ip:8080/jmx-console 就可以浏览 JBoss 的部署

overfit同步小助手 2024-08-22 08:03:56 0 收藏

大数据——Flink原理

Apache Flink 是一个强大的开源框架和分布式处理引擎，专门用于对无界和有界数据流进行有状态计算。Flink 支持高吞吐量、低延迟的实时数据流处理，同时也能够高效地处理批处理任务。其核心特点包括事件时间处理、有状态操作、容错机制，以及能够在各种常见的集群环境中运行，如 Hadoop、Kube

overfit同步小助手 2024-08-22 08:03:44 0 收藏

足球比赛结果预测系统：遗传算法的研究

遗传算法是一种模拟自然选择和遗传机制的优化算法，由约翰·霍兰德（John Holland）在1960年代提出。它通过模拟自然界的进化过程来逐步优化问题的解决方案。适应度函数用于评估每个个体（即预测模型）的预测能力。在足球比赛预测中，常用的适应度函数包括：预测准确率（Accuracy）：其中，为真实值

overfit同步小助手 2024-08-22 05:03:51 0 收藏

Git(4) 解决Git相关问题的实用技巧

本文将介绍一些Git实用的技巧，实际操作中解决常见的Git问题。

overfit同步小助手 2024-08-22 02:04:38 0 收藏

【产品经理修炼之道】- 优惠券系统从入门到精通（三十四）

前文已经提到，因为消费者不会主动告诉商家自己的心理预期价格到底是什么，通过发放一定的优惠券，商家可以把有不同支付意愿的消费者区别开来，进行长期的用户管理。当价格固定时，商家只能从固定的一群接受当前价格的消费者身上获利，而价格歧视后出现了多档价格，商家可以从新增的消费者身上获取价值。对不同的消费者收取

overfit同步小助手 2024-08-22 02:03:44 0 收藏

数据仓库的一致性维度

数据仓库中的一致性维度设计，解析其定义、作用以及设计原则

overfit同步小助手 2024-08-22 01:03:54 0 收藏

大数据-56 Kafka SpringBoot与Kafka 基础简单配置和使用 Java代码 POM文件

上节我们尝试使用了Kafka的topics.sh、producer.sh、consumer.sh，接着使用Maven的POM配置，尝试使用JavaAPI来调用操作Kafka。本节我们使用SpringBoot+Kafka，实现生产者和消费者。

overfit同步小助手 2024-08-22 01:02:17 0 收藏

数据中台之数据开发，数据开发概述与数据计算能力的类型

数据开发是数据资产内容建设的主战场，是数据价值生产过程中的核心环节，可以支撑大批量数据的离线处理、实时处理和数据挖掘等。业务沉淀的数据就像原始的矿石或商品的原材料，数据开发这个环节就像是“商品”生产的流水线，通过这条流水线将数据转换成数据资产，让数据能根据业务的需求转换成新的形态，将原本看起来没有价

overfit同步小助手 2024-08-22 00:03:49 0 收藏

Flink单机和集群环境部署教程

通过以上步骤，我们成功部署了 Flink 单机和集群环境，并实现了一个简单的 Word Count 应用。Flink 提供了强大的流处理和批处理能力，可以在多种场景下处理实时数据。

overfit同步小助手 2024-08-22 00:03:38 0 收藏

Flink入门 (二)--Flink程序的编写

其他案例demo可以参考我的GitHubhttps://github.com/NuistGeorgeYoung/flink_stream_test/ 编写一个Flink程序大致上可以分为以下几个步骤：之后你可以设置以下配置- 按行读取文件并将其作为字符串返回。- 按行读取文件并将它们作为Strin

overfit同步小助手 2024-08-21 23:03:47 0 收藏

智能制造数字化智能工厂实施路径与落地举措规划方案

随着全球制造业的转型升级，智能制造数字化智能工厂已成为行业发展的重要趋势。智能制造通过集成先进的信息技术、自动化技术和人工智能技术，实现工厂运营的智能化、自动化和数字化。本次规划方案的主要目标在于构建一个高效、灵活、可持续的数字化智能工厂，以提升生产效率、降低运营成本、增强产品质量和市场竞争力。内容

overfit同步小助手 2024-08-21 23:03:43 0 收藏

Git使用教程

访问上述链接安装完成后进行相关配置。

overfit同步小助手 2024-08-21 23:03:36 0 收藏

【大数据算法】开篇：一文掌握大数据概述、特点及应用等。

大数据算法最新专栏之：开篇

overfit同步小助手 2024-08-21 23:03:27 0 收藏

OLAP引擎之Doris

Apache Doris是一个开源的实时OLAP（Online Analytical Processing）数据库管理系统，最初由百度开发，并于2017年捐赠给Apache Software Foundation，目前已成为 Apache 顶级项目。Doris旨在提供高效的查询性能和易于使用的数据分

overfit同步小助手 2024-08-21 20:03:34 0 收藏

Elasticsearch中磁盘水位线的深度解析

Elasticsearch的磁盘水位线是一种强大的工具，它帮助管理员监控和管理Elasticsearch集群的磁盘使用情况，防止数据丢失和系统性能下降。通过合理配置和使用磁盘水位线，可以确保Elasticsearch集群的稳定性和可靠性。

overfit同步小助手 2024-08-21 14:06:29 0 收藏

MySQL中的SELECT FOR UPDATE：原理、应用与优化

是MySQL中的一种行级锁定机制，它允许在事务中对查询结果集中的行进行加锁，以防止其他事务对这些行进行修改或删除。这种锁定机制通常用于确保事务的隔离性和数据的一致性，特别是在高并发环境下。

overfit同步小助手 2024-08-21 13:02:26 0 收藏

【大厂Offer】教你如何从Flink小白成为Contributor最终拿到腾讯的Offer

一开始我也是怀揣着成为一个技术大老的梦想开始的，尽管我现在已经入职腾讯三年多了有时候觉得自己还是一个菜鸡哈.....写这个文章希望可以帮助到刚刚接触大数据，并且对技术怀揣着梦想的朋友们，大家互相学习哈

overfit同步小助手 2024-08-21 12:03:39 0 收藏