大数据 - overfit.cn

【Python大数据笔记_day10_Hive调优及Hadoop进阶】

Hive调优及Hadoop进阶

overfit同步小助手 2023-12-14 01:03:26 0 收藏

Canal-adapter简单介绍及部分源码解析

overfit同步小助手 2023-12-13 21:03:50 0 收藏

在flink-connector-jdbc中增加对国产数据库达梦(V8)的支持

本文将展示如何在flink-connector-jdbc中增加对国产数据库达梦(V8)的支持。演示基于Java语言，使用Maven。

overfit同步小助手 2023-12-13 20:06:47 0 收藏

未来人工智能将如何影响教育？

作者：禅与计算机程序设计艺术 1.简介随着人工智能的发展，教育领域也在不断发展。然而，人工智能和机器学习技术的应用却并非无所不能，它还会带来一些新的机遇和挑战，这些挑战与现有的教育模式、制度和流程息息相关。作为教育领域的专家，我认为对于中国教育的未来发展来说，需

overfit同步小助手 2023-12-13 11:01:43 0 收藏

编译 Flink代码

中，如有问题百度解决，百度没有，多试几次，可能是网络的问题。镜像仓库或者自己搭建的仓库。最重要的是第二个片段的内容。另一种编译命令，相对于上面这个命令，主要的确保是：不编译。当成功编译完成后，上述几种编译方式最终都能在当前。另外，在一些情况下，我们可能并不想把编译后的。查看 Git远程分支，我们选择

overfit同步小助手 2023-12-13 08:03:18 0 收藏

七、SAN和NAS环境下的安全实施方案实验报告

在第3、4章基础上进行SAN和NAS搭建的基础上，添加相应的安全措施来防止企业敏感数据未经授权的访问。

overfit同步小助手 2023-12-13 04:07:18 0 收藏

flink的window和windowAll的区别

window 和windowAll的区别

overfit同步小助手 2023-12-13 04:03:34 0 收藏

【HDFS实战】HDFS联合（联邦）集群的发展史

HDFS联合（联邦）机制

overfit同步小助手 2023-12-13 00:03:22 0 收藏

大数据爬虫分析基于Python+Django旅游大数据分析系统

基于Python和Django的旅游大数据分析系统是一种使用Python编程语言和Django框架开发的系统，用于处理和分析旅游行业的大数据，为旅游从业者和决策者提供有关旅游趋势、客户需求、市场竞争等方面的信息和洞见。以下是一个基本的旅游大数据分析系统的设计介绍：使用Python编程语言编写数据爬虫

overfit同步小助手 2023-12-12 22:03:49 0 收藏

使用Flink MySQL cdc分别sink到ES、Kafka、Hudi

进入hudi目录，修改hudi/pom.xml，修改对应组件的版本，由于flink使用的是scala-2.11版本，spark3.x版本以上默认使用scala-2.12预编译，为了节省时间，我们在此使用spark2.4.8以scala-2.11预编译的版本，对应的hadoop版本为2.7。- 修改h

overfit同步小助手 2023-12-12 21:03:49 0 收藏

HBase架构和部署(超级详细)

在Memstore超过一定的阈值的时候，就要新开一个进程将Memstore flush到storefile中，新的Memstore继续写入接受到的数据，当storefile越来越多时，就会降低读的性能，为了提高读的性能，可以对这些storefile进行compact操作，形多个storefile合并

overfit同步小助手 2023-12-12 21:03:44 0 收藏

什么是安全平行切面

通过嵌入在端—管—云内部的各层次切点，使得安全管控与业务逻辑解耦，并通过标准化的接口为安全业务提供内视和干预能力的安全基础设施。安全平行切面是一种创新的安全体系思想，是实现“原生安全”的一条可行路径。

overfit同步小助手 2023-12-12 18:06:51 0 收藏

HBase1.2.1集群部署,Kafka_2.11-2.00集群部署

进入Hadoop安装目录的conf目录，将配置文件core-site.xml和hdfs-site.xml复制到HBase安装目录下的conf目录，用于HBase启动时读取Hadoop的核心配置信息和HDFS配置信息。在HBase安装目录下的conf目录，执行“vim hbase-env.sh”命令编

overfit同步小助手 2023-12-12 13:03:53 0 收藏

49、Flink的Java Lambda 表达式写法示例

1、Flink 部署、概念介绍、source、transformation、sink使用示例、四大基石介绍和示例等系列综合文章链接13、Flink 的table api与sql的基本概念、通用api介绍及入门示例14、Flink 的table api与sql之数据类型: 内置数据类型以及它们的属性1

overfit同步小助手 2023-12-12 13:03:46 0 收藏

45、Flink 的指标体系介绍及验证（1）-指标类型及指标实现示例

1、Flink 部署、概念介绍、source、transformation、sink使用示例、四大基石介绍和示例等系列综合文章链接13、Flink 的table api与sql的基本概念、通用api介绍及入门示例14、Flink 的table api与sql之数据类型: 内置数据类型以及它们的属性1

overfit同步小助手 2023-12-12 11:03:31 0 收藏

解决hbase报ERROR: KeeperErrorCode = NoNode for /hbase/master

zookeeper的data使用的/tmp路径修改conf下的zoo.cfg。

overfit同步小助手 2023-12-12 09:03:44 0 收藏

【4-5章】Spark编程基础(Python版)

RDD编程、HBase读写数据、Spark SQL（DataFrame）、MySQL读写数据

overfit同步小助手 2023-12-12 09:03:15 0 收藏

【flink番外篇】1、flink的23种常用算子介绍及详细示例（1）- map、flatmap和filter

本文主要介绍Flink 的3种常用的operator（map、flatmap和filter）及以具体可运行示例进行说明.将集合中的每个元素变成一个或多个元素,并返回扁平化之后的结果。按照指定的条件对集合中的元素进行过滤,过滤出返回true/符合条件的元素。本文主要介绍Flink 的3种常用的oper

overfit同步小助手 2023-12-12 07:03:52 0 收藏

大数据Doris（二十九）：数据导入（Insert Into）

后面的 url 可以用于查询错误的数据，具体见后面查看错误行小结。Insert Into 语句的使用方式和 MySQL 等数据库中 Insert Into 语句的使用方式类似。Insert Into 命令需要通过 MySQL 协议提交，创建导入请求会同步返回导入结果。如果可见，显示 visibl

overfit同步小助手 2023-12-12 07:03:43 0 收藏

2023_Spark_实验十九：SparkStreaming入门案例

Spark Streaming networdcount 案例，netcat工具，maven管理项目依赖，

overfit同步小助手 2023-12-12 01:03:19 0 收藏