大数据 - overfit.cn

Redis到底是单线程还是多线程的？首先，Redis是一个高性能的分布式缓存中间件。其复杂性不言而喻，对于Redis整体而言肯定不是只有一个线程。我们常说的Redis 是单线程，主要是指 Redis 在网络 IO和键值对读写是采用一个线程来完成的，这也是 Redis 对外提供键值存储服务的核心流程。

overfit同步小助手 2023-04-07 17:04:12 0 收藏

RDD的创建

rdd创建

overfit同步小助手 2023-04-07 17:04:09 0 收藏

Flink 命令行参数介绍

Flink 命令行参数介绍Job Lifecycle Management ｜ Job 生命周期管理Flink Run Command | flink run 命令参数选项Flink Run Command | 通用的参数选项Flink Run Command | yarn-cluster mod

overfit同步小助手 2023-04-07 16:03:57 0 收藏

PySpark基础 —— SparkSQL

overfit同步小助手 2023-04-07 14:04:00 0 收藏

数据库数据采集利器FlinkCDC

持续分享有用、有价值、精选的优质大数据干货致力于打造全网最优质的大数据专题

overfit同步小助手 2023-04-07 14:03:41 0 收藏

2022/7 用python批量将.mat文件转为.jpg/.png/.bmp格式图片

overfit同步小助手 2023-04-07 11:03:44 0 收藏

技术瓶颈？如何解决MongoDB超大块数据问题？

MongoDB数据库实战系列，打造精品专栏。

overfit同步小助手 2023-04-07 10:03:34 0 收藏

ChatGPT入门案例｜商务智能对话客服（一）

hatGPT是人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具，使用了Transformer神经网络架构，也是GPT-3.5架构，这是一种用于处理序列数据的模型，拥有语言理解和文本生成能力，尤其是它会通过连接大量的语料库来训练模型，这些语料库包含了真实世界中的对话，使得C

overfit同步小助手 2023-04-07 10:01:26 0 收藏

为葡萄酒数据集构造SVM分类器和使用随机森林回归模型预测葡萄酒质量

基于python的数据科学导论学习，主要以SVM模型为例，并构建随机森林模型进一步预测。

overfit同步小助手 2023-04-07 09:03:46 0 收藏

程序员写博客如何赚钱「5大盈利方向」

现在不少的网站都有介绍用户消费可以提成的制度，提成 3%~8% 不等，赚取提成的方式也很简单，只要注册成推广员后，加个链接地址就可以了。现在不少的网站都有介绍用户消费能够提成的准则，提成 3%~8% 不等，赚取提成的方式也很简略，只要注册成推行员后，加个链接地址就能够了。下图展现的是，他创立的付

overfit同步小助手 2023-04-07 09:03:31 0 收藏

大数据Flink进阶（十五）：Flink On Yarn任务提交

Flink On Yarn任务提交支持Session会话模式、Per-Job单作业模式、Application应用模式。下面分别介绍这三种模式的任务提交命令和原理。为了能演示出不同模式的效果，这里我们编写准备Flink代码形成一个Flink Application，该代码中包含有2个job。

overfit同步小助手 2023-04-07 08:03:55 0 收藏

kafka的消息数据积压处理方案详解（两个方向）

通过架构图展示kafka的消息数据积压处理方案，两个原因，两个思路。

overfit同步小助手 2023-04-07 08:03:18 0 收藏

PySpark入门

1，通过pyspark进入pyspark单机交互式环境。这种方式一般用来测试代码。也可以指定jupyter或者ipython为交互环境。2，通过spark-submit提交Spark任务到集群运行。这种方式可以提交Python脚本或者Jar包到集群上让成百上千个机器运行任务。这也是工业界生产中通常使

overfit同步小助手 2023-04-07 06:03:23 0 收藏

hadoop之MapReduce框架原理

MapReduce是分为两个阶段的，MapperTask阶段，和ReduceTask阶段。Mapper阶段，可以通过选择什么方式（K,V的选择对应不同的方法）来读取数据，读取后把数据交给Mapper来进行后续的业务逻辑（用户写），让后进入Reduce阶段通过Shuffle来拉取Mapper阶段的数据

overfit同步小助手 2023-04-07 05:03:43 0 收藏

python金融分析小知识(34)——年化收益率、年化波动率以及夏普比率的计算

2000-2021年各省GDP包括名义GDP、实际GDP、GDP平减指数（以2000年为基期）

Hadoop集群配置问题—小记jps没有NameNode的问题

python数据分析及可视化（十四）数据分析可视化练习-上市公司可视化数据分析、黑色星期五案例分析

01-数据分析介绍

MySQL查询进阶——从函数到表连接的使用你还记得吗

Redis 究竟是单线程还是多线程呢？