大数据 - overfit.cn

大数据技术——DolphinScheduler的集群部署

Apache DolphinScheduler是一个分布式、易扩展的可视化DAG工作流任务调度平台。致力于解决数据处理流程中错综复杂的依赖关系，使调度系统在数据处理流程中开箱即用。工作流要求：工作流需包含三个Shell类型的任务节点，分别是A，B，C。1）创建工作流2）配置任务节点（1）节点A（2）

overfit同步小助手 2024-09-15 01:03:32 0 收藏

《基于 Spark 的平替药品智能推荐方法》

本篇文章将介绍，基于 Kafka + Spark + Redis 等技术，在药品开单的过程中，实现一种智能推荐平替药品的方案。💗 后续会逐步分享企业实际开发中的实战经验，有需要交流的可以联系博主。

overfit同步小助手 2024-09-14 22:03:46 0 收藏

大数据与云计算：塑造未来的核心驱动力

随着数据量的不断增加和数据处理的复杂化，如何确保数据的安全性和隐私性成为了一个亟待解决的问题。通过数据分析和机器学习等技术手段，大数据和云计算将支持更加智能化、自动化的决策和服务模式的发展。它们不仅推动了科技的进步和产业的升级，也深刻影响了人们的生活方式和社会经济的发展。未来随着技术的不断发展和应用

overfit同步小助手 2024-09-14 21:03:45 0 收藏

初级练习[1]:Hive数据环境搭建与SQL查询实战

【代码】Hive数据环境搭建与SQL查询实战。

overfit同步小助手 2024-09-14 20:03:49 0 收藏

全面指南：用户行为从前端数据采集到实时处理的最佳实践

在这篇文章中，我们从前端数据采集开始，逐步深入到数据接收、Kafka传输和Flink实时处理。通过这样一个完整的数据处理链路，企业可以实时了解用户行为，从而更快地做出决策，优化产品体验。这种架构设计不仅具有高扩展性和灵活性，还能够处理大量实时数据，为你的业务提供强大的数据支持。

overfit同步小助手 2024-09-14 15:02:59 0 收藏

数据分析新星，DuckDB与Pandas处理大数据速度对比

总的来说，DuckDB能够使用大家熟悉的SQL语言来快速编写并执行数据聚合查询，速度提升了几个数量级。DuckDB还支持多种文件格式，包括JSON、CSV和Excel，并且能够与多家数据库厂商的产品兼容。如果你打算在更专业的环境下使用DuckDB，你将有很多灵活的选择。

overfit同步小助手 2024-09-14 14:03:51 0 收藏

02、Kerberos安全认证之大数据集群组件搭建学习笔记

overfit同步小助手 2024-09-14 12:03:47 0 收藏

系统开发压力测试高并发

overfit同步小助手 2024-09-14 07:05:21 0 收藏

告别中间商赚差价！1688源头工厂筛选全攻略！

不管是做淘宝、天猫、拼多多、小红书等国内电商、跨境电商还是做无货源的，都会遇到找货源的问题。尤其电商新手最怕在平台上找不到真正的源头厂家和性价比高的货品，作为多年从事供应链的“买手”，今天就来聊聊如何在1688上找到源头靠谱厂家。

overfit同步小助手 2024-09-14 06:03:19 0 收藏

大数据-127 - Flink State 04篇状态原理和原理剖析：状态存储 Part2

在Flink的实际实现中，对于同一种StateBackend，不同的State在运行时会有细分的StateBackend托管，例如：MemoryStateBackend，就有DefaultOperatorStateBackend管理OperatorState，HeapKeyedStateBacken

overfit同步小助手 2024-09-14 03:03:11 0 收藏

15 本地服务业务中的推荐系统实战——工程篇

易经》“九五：飞龙在天，利见大人”。九五是指阳爻在卦中处于第五位，已接近极限。飞龙指龙飞在天上，居高临下，大展鸿图。在前面 4 个模块中，你已经掌握推荐系统的核心知识体系了。本模块主要是介绍推荐算法工程化的落地方案，实践性很强，助你灵活运用已学知识来解决实际问题。在这一讲，我们通过介绍同城本地服务业

overfit同步小助手 2024-09-14 01:03:54 0 收藏

大数据之Flink（五）

15、Flink SQL15.1、sql-client准备启用Hadoop集群(在Hadoop100上)start-all.sh启用yarn-session模式/export/soft/flink-1.13.0/bin/yarn-session.sh -d启动sql-client bin/sql-c

overfit同步小助手 2024-09-14 01:03:44 0 收藏

数开中：SQL递归函数使用场景（70天）

本文通过案例解析：数仓（Data Warehouse）中，SQL递归函数的使用场景

overfit同步小助手 2024-09-13 22:02:26 0 收藏

NVR方案背景与产品介绍与构建一套完整的NVR产品解决方案

此外，NVR还可以支持更多的应用场景，由于视频监控系统越来越需要具备扩展性，如果计划在未来增加更多的IP摄像机，那么NVR可能更适合。基于 HiSilicon 平台的 NVR 解决方案凭借其卓越的性能和灵活的功能，已经在市场上占据了一定的份额，并且具有广阔的市场前景。通过友好的管理界面，管理员可以轻

overfit同步小助手 2024-09-13 20:07:51 0 收藏

git commit后发现git pull 拉取代码失败的解决方案（致命错误：需要指定如何调和偏离的分支。）

overfit同步小助手 2024-09-13 15:05:21 0 收藏

mongodb分片集群搭建

分片集群2: (10.168.2.138:27012、10.168.4.204:27012、10.168.4.205:27012)分片集群1:（10.168.2.138:27011、10.168.4.204:27011、10.168.4.205:27011）第一步：添加mongodb yum仓库 :

overfit同步小助手 2024-09-13 13:03:42 0 收藏

大数据技术之Zookeeper客户端 API 操作（4）

保证 hadoop12、hadoop13、hadoop14 服务器上的 Zookeeper 集群服务端已启动。

overfit同步小助手 2024-09-13 12:03:56 0 收藏

关于电力大数据关键技术及应用的探讨

在生产领域，平台以无人机、电网自动化设备、可视化移动作业终端为载体，通过使用其嵌入式系统技术、流媒体及传感器技术，实现视频的在线监控实时调取，并对电网的负荷曲线趋势监控，对监测到的故障及风险提前消缺提前预防，保障电网的安全稳定运行。通过引入人脸识别技术，实现对平台访问客户进行准确识别，以友好方式迎接

overfit同步小助手 2024-09-13 10:03:50 0 收藏

大数据新视界 --大数据大厂之数据可视化之美：用 Python 打造炫酷大数据可视化报表

本文聚焦用 Python 打造炫酷大数据可视化报表。介绍了 Matplotlib、Seaborn 和 Plotly 等库，通过代码示例展示柱状图、折线图、散点图矩阵等可视化效果。还阐述了交通流量、医疗数据、电商用户行为等实际应用案例及数据分析方法。强调数据可视化连接抽象数据与直观认知，Python

overfit同步小助手 2024-09-13 10:03:32 0 收藏

基于大数据的网络电视剧收视率分析系统设计与实现

今天带来的是基于大数据的网络电视剧收视率分析系统设计与实现，在当今多媒体时代，网络电视剧已成为主流娱乐方式之一。随着互联网的普及和在线视频平台的迅猛发展，观众逐渐从传统电视转向网络平台观看电视剧。这一转变不仅改变了人们的观影习惯，也对电视剧内容制作、发布及评价体系带来了深远影响。在这样的背景下，如何

overfit同步小助手 2024-09-13 08:03:57 0 收藏