人工智能机器学习

Haar级联分类器概述

Haar级联分类器概述—— 才疏学浅, 难免有错误和遗漏, 欢迎补充和勘误.Haar级联分类器是基于Haar-like特征，运用积分图加速计算，并用Adaboost训练的强分类器级联的方法来进行人脸检测。目前常用Haar-like特征的分类有：图1. Haar-like特征分类首先定义每个Haar

overfit同步小助手 2023-05-20 06:01:30 0 收藏

通俗易懂的GPT原理简介

综上所述，GPT是自然语言处理领域中最强大的模型之一，它的出色表现已经使得它在各种应用场景中得到了广泛的应用。

overfit同步小助手 2023-05-19 16:01:59 0 收藏

《PyTorch高级机器学习实战》包邮送书三本

overfit同步小助手 2023-05-19 10:01:39 0 收藏

垃圾邮件识别（一）：用机器学习做中文邮件内容分类

总的来说，一封邮件可以分为发送人、接收人、抄送人、主题、时间、内容等要素，所以很自然的可以认为主要通过上述要素中的发送方、主题以及内容来进行垃圾邮件判断。因此我们依次对上述要素进行分析：垃圾邮件内容分类（通过提取垃圾邮件内容进行判断）中文垃圾邮件分类英文垃圾邮件分类垃圾邮件标题分类垃圾邮件发送方分类

overfit同步小助手 2023-05-18 21:01:49 0 收藏

python-机器学习-波士顿房价回归分析

以波士顿房价数据集为对象，理解数据和认识数据，掌握和的初步方法，掌握的一般方法，对回归分析的结果解读。

overfit同步小助手 2023-05-18 21:01:34 0 收藏

Copyleaks：AI抄袭和内容检测工具

Copyleaks是一个基于AI人工智能的抄袭和内容检测工具，可以帮助用户在互联网上发现和防止内容被盗用。支持检测各种类型的文本，包括学术论文、网站内容、商业文件、法律合同、创意作品等，并提供详细的相似度报告和原始来源链接。还可以检测图像中的文字，并将其与在线数据库进行比较，以发现潜在的剽窃行为。

overfit同步小助手 2023-05-18 16:02:33 0 收藏

模型评估方法(AUC等)

模型评估方法，适合初学者入门

overfit同步小助手 2023-05-18 16:01:33 0 收藏

自然语言处理—文本分类综述/什么是文本分类

最近在学习文本分类，读了很多博主的文章，要么已经严重过时（还在一个劲介绍SVM、贝叶斯)，要么就是机器翻译的别人的英文论文，几乎看遍全文，竟然没有一篇能看的综述，花了一个月时间，参考了很多文献，特此写下此文。思维导图https://www.processon.com/mindmap/61888043

overfit同步小助手 2023-05-18 15:01:53 0 收藏

（跨模态）AI作画——使用stable-diffusion生成图片

自从DallE问世以来，AI绘画越来越收到关注，从最初只能画出某些特征，到越来越逼近真实图片，并且可以利用prompt来指导生成图片的风格。前不久，stable-diffusion的v1-4版本终于开源，本文主要面向不熟悉huggingface的同学，介绍一下stable-diffusion如何使用

overfit同步小助手 2023-05-18 15:01:43 0 收藏

ChatGPT国内免费使用方法有哪些?

介绍国内几种免费使用chatgpt方法

overfit同步小助手 2023-05-18 08:01:55 0 收藏

概率统计笔记：二维随机变量及其联合概率分布

联合分布函数

overfit同步小助手 2023-05-18 06:01:34 0 收藏

关于stable diffusion的embedding训练的一篇随笔

最大步数根据你自己需要。画风15000-18000差不多就行，画手3-4w差不多，数据集目录就是上文让你新建的文件夹目录，下面打钩按图走，其他所有参数都不需要改，然后点击左下角训练即可。然后你就可以挂机干别的去啦~比如补补番，玩玩手机，总之，训练会消耗非常大的资源和很长的时间，这个时间基本就告别电脑

overfit同步小助手 2023-05-18 06:01:30 0 收藏

一文读懂“生成式 AI”

人工智能是关于赋予机器以模拟人类智能的能力的广泛领域。它涉及使计算机系统能够执行类似于人类智能的任务，如语音识别、图像识别、自然语言处理和决策制定等。人工智能旨在使机器具备像人类一样的推理、学习、问题解决和决策能力。机器学习是人工智能的一个分支，它是通过数据和统计模型来让机器自动学习和改进的一种方法

overfit同步小助手 2023-05-18 00:02:07 0 收藏

OpenAI Embedding：基于人工智能的搜索新篇章

theme: orange本文正在参加「金石计划」 Embedding模型在许多应用场景中都有广泛的应用。在OpenAI中，文本嵌入技术主要用于衡量文本字符串之间的相关性。什么是Embedding嵌入(Embeddings)是一种将离散变量表示为连续向量的方法。它在机器学习中起到了不可或缺的作用。

overfit同步小助手 2023-05-18 00:01:33 0 收藏

知识蒸馏（Knowledge Distillation）

快乐学习

overfit同步小助手 2023-05-17 16:01:35 0 收藏

InstructGLM:基于ChatGLM-6B在指令数据集上进行微调

基于ChatGLM-6B+LoRA在指令数据集上进行微调。

overfit同步小助手 2023-05-17 00:01:57 0 收藏

gpt的优势和gpt缺点

GPT可以根据给定的上下文信息生成质量很高的语句，甚至可以生成完整的文章、故事等长文本，和人类写作风格非常接近。随着训练的深入，GPT技术的语言生成质量也将不断提升。只能实现单向文本生成：与一些双向解码器（如BERT）不同，GPT采用单向的解码器，只能利用前面的上下文信息进行生成，无法利用后面的文本

overfit同步小助手 2023-05-17 00:01:53 0 收藏

ChatDOC：基于 AI 与文档对话、重新定义阅读方式的文献阅读和文档处理神器

上面主要是基于全文的提问。ChatDOC 是一款基于 ChatGPT，允许 ChatGPT 与用户所指定的文档进行对话，处理用户的专属数据的 AI 阅读辅助工具。不同于 ChatGPT 的处于黑箱之中、无法追溯来源的答案，ChatDOC 的特点在于，AI 所生成的结果均是基于用户所提供的专有数据，如

overfit同步小助手 2023-05-16 19:01:40 0 收藏

深入理解机器学习——过拟合（Overfitting）与欠拟合（Underfitting）

机器学习的主要挑战是我们的算法必须能够在先前未观测的新输入上表现良好，而不只是在训练集上表现良好。在先前未观测到的输入上表现良好的能力被称为泛化（Generalization）。通常情况下，当我们训练机器学习模型时，我们可以使用某个训练集，在训练集上计算一些被称为训练误差（Training Rrr

overfit同步小助手 2023-05-16 18:01:50 0 收藏

kaggle（白嫖免费GPU，新手必看！！！）

超详细新手白嫖kaggle GPU教程，不可错过哦

overfit同步小助手 2023-05-16 12:01:47 0 收藏