机器学习 - overfit.cn

数学建模常用算法—马尔可夫预测

马尔可夫预测模型

overfit同步小助手 2023-09-09 04:01:26 0 收藏

Excel小技巧,使用函数（INDEX+MATCH）快速进行条件查询

overfit同步小助手 2023-09-08 13:01:45 0 收藏

AI 大模型 LLM 的基础概念、核心算法原理数学模型和发展历史及其应用领域

文本摘要是指从大量的文本中提取关键信息，并生成简洁、易于理解的摘要。LLM能够通过对文本进行编码和自动摘要，从而提高文本摘要的质量和效率。总之，LLM是自然语言处理领域中的一个重要组成部分，它通过对大量数据进行训练，实现了自然语言理解、文本分类、机器翻译、文本摘要等多种自然语言处理任务。在未来的发展

overfit同步小助手 2023-09-05 12:01:48 0 收藏

Pandas DataFrame 数据存储格式比较

Pandas 支持多种存储格式，在本文中将对不同类型存储格式下的Pandas Dataframe的读取速度、写入速度和大小的进行测试对比。

Deephub 2023-09-05 09:47:59 0 收藏

【机器学习】人工智能概述（文末送书）

机器学习和人工智能，深度学习的关系人工智能（AI）：人工智能是一门研究如何使计算机能够模拟、理解和执行人类智能任务的学科。它的目标是让计算机具备类似于人类的智能水平，可以进行推理、学习、感知和决策。机器学习：机器学习是人工智能的一个重要分支，它是让计算机通过从数据中学习和提取模式，自动改进执行特定任

overfit同步小助手 2023-09-05 08:01:31 0 收藏

多模态推荐系统综述

多模态推荐综述

overfit同步小助手 2023-09-04 22:02:11 0 收藏

faiss的简单使用

全称(Facebook AI Similarity Search)是Facebook AI团队开源的针对聚类和相似性搜索库，为稠密向量提供高效相似度搜索和聚类，支持十亿级别向量的搜索，是目前较成熟的近似近邻搜索库。它包含多种搜索任意大小向量集（备注：向量集大小由RAM内存决定）的算法，以及用于算法评

overfit同步小助手 2023-09-04 17:02:17 0 收藏

15个基本且常用Pandas代码片段

以上这15个Pandas代码片段是我们日常最常用的数据操作和分析操作。熟练的掌握它，并将它们合并到工作流程中，可以提高处理和探索数据集的效率和效果。

Deephub 2023-09-03 10:26:03 0 收藏

大数据、人工智能、机器学习、深度学习关系联系前言

1.大数据和人工智能关系2.机器学习、深度学习、人工智能关系3.监督学习、无监督学习、半监督学习、强化学习、迁移学习关系4.机器学习具体内容

overfit同步小助手 2023-09-02 17:04:28 0 收藏

20用于深度学习训练和研究的数据集

本文将整理常用且有效的20个数据集。

Deephub 2023-09-02 09:43:33 0 收藏

大数据笔记--Spark机器学习（第一篇）

一、数据挖掘与机器学习1、概念2、人工智能3、数据挖掘体系二、机器学习1、什么是机器学习2、机器学习的应用3、实现机器学习算法的工具与技术框架三、Spark MLlib介绍1、简介2、MLlib基本数据类型Ⅰ、概述Ⅱ、本地向量Ⅲ、向量标签的使用Ⅳ、本地矩阵Ⅴ、分布式矩阵的使用3、MLlib统计量基础

overfit同步小助手 2023-09-01 20:04:11 0 收藏

Pandas 2.1发布了

2023年3月1日，Pandas 发布了2.0版本。6个月后（8月30日），更新了新的2.1版。让我们看看他有什么重要的更新。

Deephub 2023-09-01 09:17:13 0 收藏

生成模型相关算法：EM算法步骤和公式推导

EM 算法是一种选代算法，1977 年 Dempster 等人总结提出，用于含有隐变量(hidden variable)的概率模型参数的极大似然估计，或极大后验概率估计EM算法的每次选代由两步组成:E步，求期望 (expectation);一般地，用Y表示观测随机变量的数据，Z表示隐随机变量的数据Y

overfit同步小助手 2023-08-31 22:06:48 0 收藏

是否在业务中使用大语言模型？

但LLM究竟是什么，它们如何使你的企业受益?它只是一种炒作，还是会长期存在?

Deephub 2023-08-31 10:12:46 0 收藏

cuml机器学习GPU库 sklearn升级版AutoDL使用

最近在做机器学习任务的时候发现我自己的数据集太大，直接用sklearn 跑起来时间很长，然后问GPT得知了有CUML库，后来去研究了一下，发现这个库只支持linux系统，从官网直接获取下载命令基本上也实现不了最后，选择使用AutoDL租了一个GPU来安装这个库。具体步骤如下。如果是正常讨论的话本身电

overfit同步小助手 2023-08-30 15:11:14 0 收藏

机器学习基础之《分类算法（4）—案例：预测facebook签到位置》

place_id：预测用户将要签到的位置。accuracy：定位的准确率。row_id：签到行为的编码。x y：坐标系，人所在的位置。

overfit同步小助手 2023-08-30 15:10:25 0 收藏

概念解析 | 量子机器学习：将量子力学与人工智能的奇妙融合

随着量子计算技术的发展，人们开始探索其在其他领域的应用，其中之一就是机器学习。量子机器学习利用量子计算的高度并行性和优越的计算能力，有望解决传统机器学习在处理大规模复杂数据时的困难。量子机器学习的基础是量子计算，它利用量子比特（qubit）来进行计算。量子比特可以处于0和1的超位置状态，这使得量子计

overfit同步小助手 2023-08-30 15:05:18 0 收藏

机器学习基础13-基于集成算法优化模型（基于印第安糖尿病 Pima Indians数据集）

有时提升一个模型的准确度很困难。如果你曾纠结于类似的问题，那我相信你会同意我的看法。你会尝试所有曾学习过的策略和算法，但模型正确率并没有改善。这时你会觉得无助和困顿，这也是90%的数据科学家开始放弃的时候。不过，这才是考验真本领的时候！这也是普通的数据科学家和大师级数据科学家的差距所在。前面介绍了一

overfit同步小助手 2023-08-30 15:05:04 0 收藏

机器学习基础11-算法比较（基于印第安糖尿病Pima Indians 数据集）

比较不同算法的准确度，选择合适的算法，在处理机器学习的问题时是非常重要的。本节将介绍一种模式，在scikit-learn中可以利用它比较不同的算法，并选择合适的算法。你可以将这种模式作为自己的模板，来处理机器学习的问题；也可以通过对其他不同算法的比较，改进这个模板。

overfit同步小助手 2023-08-30 15:01:41 0 收藏

k210部署自行训练的口罩识别模型

自己训练了一个口罩识别模型，踩了不少坑

overfit同步小助手 2023-08-30 12:02:00 0 收藏