大数据 - overfit.cn

大数据-之LibrA数据库系统告警处理（ALM-12042 关键文件配置异常）

检查“/etc/fstab”文件中配置的分区，是否在“/proc/mounts”中能找到。检查在“fstab”中配置的swap分区，是否和“/proc/swaps”一一对应。系统每隔一个小时检查一次系统中关键的配置是否正确，如果不正常，则上报故障告警。查看是否存在以下几种情况，如果是，则说明该配置文

overfit同步小助手 2023-12-15 00:03:49 0 收藏

大数据学习(23)-hive on mapreduce对比hive on spark

需要注意的是，随着 Apache Spark 的普及和发展，Hive on Spark 逐渐成为主流的 Hive 运行环境。许多公司和组织已经将 Spark 作为其默认的计算引擎，并逐渐将 Hive 从 MapReduce 迁移到 Spark 上。Hive on Spark 和 Hive on Ma

overfit同步小助手 2023-12-14 22:03:45 0 收藏

Can artificial intelligence (AI) assist in identifying

作者：禅与计算机程序设计艺术 1.简介最近，随着社会对网络的日益关注和重视，很多网站都开始提供个人用户的隐私信息，这就使得个人用户在网上的数据也越来越多。基于用户的个人数据，就可以搜集到大量的用户画像，这些用户画像可以帮助互联网企业为其提供更好的服务和营销方式。

overfit同步小助手 2023-12-14 22:01:43 0 收藏

大数据HCIE成神之路之数学（2）——线性代数

线性代数是一门被广泛运用于各工程技术领域的学科。用线性代数的相关概念和结论，可以极大地简化数据挖掘中相关公式的推导和表述。线性代数将复杂的问题简单化，让我们能够对问题进行高效地数学运算。线性代数是一个数学工具，它不仅提供了有助于操作数组的技术，还提供了像向量和矩阵这样的数据结构用来保存数字和规则，以

overfit同步小助手 2023-12-14 21:03:36 0 收藏

Flink（九）CEP

Flink CEP

overfit同步小助手 2023-12-14 18:03:46 0 收藏

最佳实践！ StreamPark 在顺网科技的生产实践, 如何支撑大规模 Flink 作业

本文主要介绍顺网科技在使用 Flink 计算引擎中遇到的一些挑战，基于 StreamPark 作为实时数据平台如何来解决这些问题，从而大规模支持公司的业务。

overfit同步小助手 2023-12-14 16:03:39 0 收藏

Python 人工智能实战：聊天机器人

作者：禅与计算机程序设计艺术 1.背景介绍聊天机器人的应用场景不亚于人与人之间进行交流沟通，但传统的聊天机器人并不能完全实现人类对话的功能。在对话中，人类往往会产生更多更丰富的信息需要表达出来，而这些信息也必须能够被聊天机器人理解、生成文本。为了实现聊天机器人的

overfit同步小助手 2023-12-14 15:01:36 0 收藏

spark -- 数据计算框架

spark作为大数据组件中不可或缺的一大部分是我们学习和了解大数据的过程中必须要经历和学习的部分本人将自己当初学习大数据的一点点心得和体会作为笔记希望可以给同样在学习大数据同学提供一点点的帮助同时也希望可以得到大家的指正。

overfit同步小助手 2023-12-14 12:03:37 0 收藏

Flink 有状态流式处理

做法就是没处理完一笔，更改完状态之后，就做一次快照（包含它处理的数据在队列中的位置和它处理到的位置以及当时的状态进行对比）【1】如下图，当我们从数据源获取数据的时候，其实我们已经开始有状态了，这个时候我们可以把任务处理的整个过程抽象成如下图中的一张表。我们要处理一个持续维护的状态时，最适合的方式就是

overfit同步小助手 2023-12-14 08:03:23 0 收藏

基于大数据的宠物领养系统设计与实现

首先，基于大数据的宠物领养管理系统可以收集和存储大量关于宠物领养过程的信息，以便更好地了解宠物领养流程，分析宠物领养申请人的需求，并根据申请人的需求提供更合理、更有效的领养解决方案。此外，基于大数据的宠物领养管理系统还可以实时监控宠物领养过程中的宠物状态，以便随时了解宠物的健康状况，以确保宠物的安全

overfit同步小助手 2023-12-14 07:03:41 0 收藏

skywalking操作手册

EntrySpan代表服务提供商。它也是服务器端的端点。作为一个APM系统，我们的目标是应用程序服务器。因此，几乎所有的服务和MQ消费者都是EntrySpan。LocalSpan 表示一种不涉及远程服务的普通 Java 方法。它既不是 MQ 生产者/消费者也不是服务（例如 HTTP 服务）提供者

overfit同步小助手 2023-12-14 04:03:28 0 收藏

【Python大数据笔记_day10_Hive调优及Hadoop进阶】

Hive调优及Hadoop进阶

overfit同步小助手 2023-12-14 01:03:26 0 收藏

Canal-adapter简单介绍及部分源码解析

overfit同步小助手 2023-12-13 21:03:50 0 收藏

在flink-connector-jdbc中增加对国产数据库达梦(V8)的支持

本文将展示如何在flink-connector-jdbc中增加对国产数据库达梦(V8)的支持。演示基于Java语言，使用Maven。

overfit同步小助手 2023-12-13 20:06:47 0 收藏

未来人工智能将如何影响教育？

作者：禅与计算机程序设计艺术 1.简介随着人工智能的发展，教育领域也在不断发展。然而，人工智能和机器学习技术的应用却并非无所不能，它还会带来一些新的机遇和挑战，这些挑战与现有的教育模式、制度和流程息息相关。作为教育领域的专家，我认为对于中国教育的未来发展来说，需

overfit同步小助手 2023-12-13 11:01:43 0 收藏

编译 Flink代码

中，如有问题百度解决，百度没有，多试几次，可能是网络的问题。镜像仓库或者自己搭建的仓库。最重要的是第二个片段的内容。另一种编译命令，相对于上面这个命令，主要的确保是：不编译。当成功编译完成后，上述几种编译方式最终都能在当前。另外，在一些情况下，我们可能并不想把编译后的。查看 Git远程分支，我们选择

overfit同步小助手 2023-12-13 08:03:18 0 收藏

七、SAN和NAS环境下的安全实施方案实验报告

在第3、4章基础上进行SAN和NAS搭建的基础上，添加相应的安全措施来防止企业敏感数据未经授权的访问。

overfit同步小助手 2023-12-13 04:07:18 0 收藏

flink的window和windowAll的区别

window 和windowAll的区别

overfit同步小助手 2023-12-13 04:03:34 0 收藏

【HDFS实战】HDFS联合（联邦）集群的发展史

HDFS联合（联邦）机制

overfit同步小助手 2023-12-13 00:03:22 0 收藏

大数据爬虫分析基于Python+Django旅游大数据分析系统

基于Python和Django的旅游大数据分析系统是一种使用Python编程语言和Django框架开发的系统，用于处理和分析旅游行业的大数据，为旅游从业者和决策者提供有关旅游趋势、客户需求、市场竞争等方面的信息和洞见。以下是一个基本的旅游大数据分析系统的设计介绍：使用Python编程语言编写数据爬虫

overfit同步小助手 2023-12-12 22:03:49 0 收藏