大数据 - overfit.cn

【大数据】什么是数据架构？

本文回顾了数据架构从早期的文件系统时代到现代云计算和数据湖的发展历程。探讨了关系数据库的兴起、数据仓库和数据挖掘技术的发展、大数据和NoSQL的兴起，以及云数据架构的创新。

overfit同步小助手 2024-09-02 18:04:04 0 收藏

AI答题应用平台相关面试题

用户模块：提供登录、用户增删改查等管理功能应用模块：提供应用增删改查、管理、分享等功能题目模块：提供题目增删改查、管理等功能评分模块：提供评分规则定制、答案评分功能回答模块：提供回答记录查看、管理功能AI 模块：提供 AI 创建题目、AI 智能评分功能用户登录后，使用应用模块创建应用或者获取应用信息

overfit同步小助手 2024-09-02 18:01:26 0 收藏

解读开关柜无线测温系统：电力设备的安全卫士

关柜在运行过程中，由于接触不良、过载等原因，容易导致局部过热。如果不能及时发现并处理这些过热问题，可能会引发设备故障，甚至造成停电事故，给生产和生活带来严重影响。因此，实时、准确地监测开关柜内部的温度变化，对于保障开关柜的安全运行具有重要意义。

overfit同步小助手 2024-09-02 17:07:35 0 收藏

代表性大数据技术：Hadoop、Spark与Flink的框架演进

本文回顾了大数据技术发展的几个重要里程碑，从MapReduce编程模型的提出到Hadoop、Spark和Flink等大数据框架的涌现。

overfit同步小助手 2024-09-02 17:03:55 0 收藏

数据仓库系列10：如何处理维度表中的变化类型?

在深入探讨维度表的变化类型之前,我们需要先明确维度表的定义和作用。维度表是数据仓库中的一种重要表类型,它用于存储与事实表中的数值度量相关的描述性信息。事实表可能包含销售金额、数量等数值信息维度表则可能包含客户信息、产品详情、时间等描述性数据包含描述性属性通常数据量相对较小与事实表形成星型或雪花模型用

overfit同步小助手 2024-09-02 17:03:48 0 收藏

简单高效的产品设计方法论，都给我学！

实用有效的产品设计方法论

overfit同步小助手 2024-09-02 16:03:57 0 收藏

git 本地分支如何关联远程分支

【代码】git 使用场景本地分支关联远程分支。

overfit同步小助手 2024-09-02 11:04:14 0 收藏

大数据 (Big Data) 基础详解

尽管面临诸多挑战，但随着技术的不断发展和完善，大数据必将在未来发挥更大的作用，为社会带来更多的价值。例如，通过分析病患的电子病历和基因数据，可以制定个性化的治疗方案，提高治疗效果。例如，通过分析交易数据和社交媒体数据，可以实时监测市场变化，预测风险，防范金融欺诈。因此，确保数据的安全性是大数据技术应

overfit同步小助手 2024-09-02 08:03:46 0 收藏

关于git clone速度极慢的解决方法

如果没有一个可靠且稳定的魔法，接下来的就不用看了。

overfit同步小助手 2024-09-02 05:04:07 0 收藏

Linux系统下虚拟机中安装（搭建）hive的详细教程

前面，我们已经在虚拟机中安装配置了linux，接下来我们将在虚拟机中安装hive。一、安装hive压缩包1、启动虚拟机①打开VMware、MobaXterm，启动虚拟机集群；②上传hive的tar压缩包至linux系统下目录（仍然为单节点安装，同样在第一台虚拟机上安装）2、安装hive①进入hi

overfit同步小助手 2024-09-02 03:03:31 0 收藏

Data + AI 一体架构的创新引领，开启智能数据时代新篇章

overfit同步小助手 2024-09-01 23:01:39 0 收藏

数据人，需要了解的数据要素、数据资产、数据治理、数据产品、数据共享、主数据、元数据

一文略讲数据要素、数据资产、数据治理、数据产品、数据共享、主数据、元数据

overfit同步小助手 2024-09-01 20:03:53 0 收藏

大数据基础：数仓架构演变

但是很快，他们也发现自己陷入了某种困境：随着数据集市的不断增多，这种架构的缺陷也逐步显现，公司内部独立建设的数据集市由于遵循不同的标准和建设原则，以致多个数据集市的数据混乱和不一致，解决以上问题，还需回归到范式建模。在Lambda架构中，为了计算一些实时指标，就在原来的离线数仓基础之上增加了一个实时

overfit同步小助手 2024-09-01 20:03:46 0 收藏

Hadoop的HA配置与实现（ZooKeeper）

将112的tmp目录复制到113上（113为备用的主节点）和dfs.namenode.http-address.

overfit同步小助手 2024-09-01 19:03:35 0 收藏

2024年大数据高频面试题(下篇）

本文详细介绍大数据岗位热门高频面试题并附有详细答案说明，下篇包含scala、即席查询、分区、分桶、分片、调度系统、数据倾斜等内容的常见面试题

overfit同步小助手 2024-09-01 18:03:45 0 收藏

Flink CDC基本概念以及MySQL同步到MySQL

本文基于Flink CDC v2.4.2版本和Flink 1.17.1版本。

overfit同步小助手 2024-09-01 15:03:40 0 收藏

Flink最全文档

Flink Application集群：Flink Application集群不需要启动，我们手动写好了应用程序的逻辑代码之后，打包成jar包，然后用Application集群调用就可以了（main方法），应用程序是在集群上面运行的，而不是在客户端上面运行的。slot是在提交任务的时候分配，任务完成

overfit同步小助手 2024-09-01 12:03:39 0 收藏

IT管理：我与IT的故事1--努力是成功的序曲

部门开会时，说起业务需求，时不时抱怨业务部门不真懂业务，需求提得不到位，影响进度，影响质量，等等。当你跟其他人共识不同的时候，你会发现身边到处都是敌人，所有人都不懂你的用心良苦，也无法理解你做的这件事有多大的意义，只会轻飘飘的一句“你随便弄一下不就好了”。我在主管需求提出部门的时候，要求用户部门：尊

overfit同步小助手 2024-09-01 11:03:51 0 收藏

基于spark的美食餐厅分析推荐系统-附源码83884

通过这一系统，用户可以更好地发现、选择和享受美食，提升了用户的生活品质和饮食体验。总之，美食餐厅分析推荐系统将为用户提供更丰富的美食选择，促进美食文化的传播和发展，满足用户对美食的需求和期待，是一项具有广泛应用前景的系统。

overfit同步小助手 2024-09-01 11:03:43 0 收藏

【有源码】大数据背景下基于Python的旅游数据可视化分析与推荐系统k-means满意度分析

大数据背景下基于Python的旅游数据可视化分析与推荐系统的设计内容涵盖了从数据采集到最终呈现的完整链条，系统将通过网络爬虫技术，从主流旅游评论平台收集海量的用户评价、景点信息等原始数据。针对收集到的数据进行清洗和预处理，确保数据的质量和一致性。在数据分析阶段，系统将运用先进的大数据处理技术，对旅游

overfit同步小助手 2024-09-01 10:03:45 0 收藏