人工智能机器学习

【AI大模型】Transformers大模型库（四）：AutoTokenizer

本文对使用transformers的AutoTokenizer进行介绍，他最大的特点是允许开发者通过一个统一的接口来加载任何预训练模型对应的分词器（tokenizer），而无需直接指定分词器的精确类型。这意味着，当知道模型的名称时，可以使用AutoTokenizer自动获取与该模型匹配的分词器。

overfit同步小助手 2024-06-07 14:01:21 0 收藏

人工智能课程设计毕业设计——基于机器学习的贷款违约预测

另外LightGBM通过使用基于直方图的决策树算法，只保存特征离散化之后的值，代替XGBoost使用exact算法中使用的预排序算法（预排序算法既要保存原始特征的值，也要保存这个值所处的顺序索引），减少了内存的使用，并加速的模型的训练速度。Adaboost是一种迭代算法，其核心思想是针对同一个训练集

overfit同步小助手 2024-06-06 14:01:41 0 收藏

登天文学顶刊MNRAS！中科院上海天文台利用AI发现107例中性碳吸收线，探测精度达99.8%

其中，包括碳、氧、硅等元素的星际尘埃也随着爆发的扩散在星际介质中富集，不但为新恒星和行星系统的形成提供了重要的物质基础，也在星际介质的冷却和凝聚过程中起着关键作用。然后，由两个 12Å 的窗口连接在一起形成一个 100 元素长的一维通量数组，便能够提供对局部光谱特性和信噪的清晰视图，同时不包括吸收线

overfit同步小助手 2024-06-05 21:01:20 0 收藏

一切模型皆可联邦化：高斯朴素贝叶斯代码示例

一般情况下我们对联邦学习的理解都是大模型和深度学习模型才可以进行联邦学习，其实基本上只要包含参数的机器学习方法都可以使用联邦学习的方法保证数据隐私。

Deephub 2024-06-05 10:50:26 0 收藏

机器学习AI大模型的开源与闭源：哪个更好？

在过去的几年里，人工智能（AI）和机器学习（ML）技术的发展突飞猛进，成为科技领域最具革命性的进步之一。随着这一技术的普及，关于AI模型的开源与闭源的争论也逐渐升温。本文将深入探讨AI模型的开源与闭源，分析其优缺点，并讨论哪个更适合当今的科技发展。

overfit同步小助手 2024-06-05 08:01:41 0 收藏

当代人工智能三教父——深度学习三巨头

今天下午闲来无事翻阅了一下csdn首页的头条文章——《27 岁天才创始人Joel Hellermark分享了自己和“AI 教父”Geoffery Hinton的最新采访》感觉挺有意思，就从头到尾的看了一遍，里面有很多自己以前从未涉及到的知识，就浅显的整理了一下：

overfit同步小助手 2024-06-04 23:01:35 0 收藏

工具系列：PandasAI介绍_快速入门

所做的类似（10分钟入门pandas -> https://pandas.pydata.org/docs/user_guide/10min.html），我们希望创建最简单的方式来学习如何掌握PandasAI。由于PandasAI由LLM提供支持，您应该导入您想要用于您的用例的LLM。有时候，您可能希

overfit同步小助手 2024-06-04 07:01:11 0 收藏

支持向量机SVM代码详解——多分类/降维可视化/参数优化【python】

主要介绍数学建模以及大数据比赛中常用的SVM支持向量机模型算法，并使用python实现实例二分类、多分类、可视化以及参数优化。

overfit同步小助手 2024-06-03 20:02:20 0 收藏

【文末附gpt升级秘笈】GPT-4级别AI系统的主要应用场景

GPT-4级别的AI系统安全性保障是一个复杂且多层面的任务，涉及到数据隐私、模型输出控制、恶意利用防范以及伦理规范等多个方面。以下是对GPT-4级别AI系统安全性保障的详细分析和建议：一、数据隐私保护二、模型输出控制三、恶意利用防范四、伦理规范与监管综上所述，GPT-4级别的AI系统安全性保障需要从

overfit同步小助手 2024-06-03 19:01:48 0 收藏

一文搞懂人工智能、机器学习、深度学习和大模型

当我们谈论人工智能（AI），机器学习（Machine Learning），深度学习（Deep Learning），以及大模型（Large Models）时，实际上是在讨论人类如何让计算机学会像我们一样思考、学习和做出决策的技术。但是很多人都分不清他们之间的区别，今天我来给大家讲一下。想象一下，你正在

overfit同步小助手 2024-06-02 20:01:37 0 收藏

Phidata：快速构建一个智能 AI 助手【附代码示例】

Phidata是一个尖端的框架，专为开发具有超越传统语言模型能力的自治助手（或称为代理）而设计。这些 AI 助手拥有长期记忆、深入的情境理解能力以及通过函数调用执行操作的能力，使它们在各种应用中非常有效。项目近期在Github上非常火爆：https://github.com/phidatahq/ph

overfit同步小助手 2024-06-02 10:01:33 0 收藏

通过f-string编写简洁高效的Python格式化输出代码

Python 3.6中引入的f-string是Python中最常用的特征之一，它可以让我们编写更干净、更高效和更易于维护的代码，我们今天就由浅入深来详细介绍使用它的一些技巧。

Deephub 2024-06-02 09:35:13 0 收藏

【机器学习】与【人工智能】的无限创意——【六一儿童节】的科技奇幻旅程

六一儿童节是孩子们期盼已久的节日，而随着科技的飞速发展，我们有机会利用前沿技术为孩子们带来更多的乐趣和知识。进入一个奇幻的科技世界，结合机器学习和人工智能技术，通过具体的项目实例，展示如何在六一儿童节为孩子们打造一个智能互动的学习和娱乐体验。

overfit同步小助手 2024-06-02 09:01:25 0 收藏

【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型

人工智能（AI）是指模拟人类智能的机器或计算机系统。它通过学习、推理、感知和语言理解等能力，执行通常需要人类智能才能完成的任务。人工智能的目标是创造能够自主解决问题和适应环境变化的智能系统。机器学习（ML）是人工智能的一个分支，它通过算法和统计模型，使计算机能够从数据中学习和做出决策，而无需显式编程

overfit同步小助手 2024-06-01 08:01:27 0 收藏

【机器学习】AI大模型的探索—分析ChatGPT及其工作原理

1.1 什么是ChatGPTChatGPT是一个由OpenAI开发的自然语言处理模型，基于生成式预训练变换器（Generative Pre-trained Transformer，简称GPT）架构。它旨在通过理解和生成类似人类的文本来进行对话和回答问题。ChatGPT能够根据输入文本的上下文生成连贯

overfit同步小助手 2024-06-01 08:01:15 0 收藏

生成式 AI：使用 Pytorch 通过 GAN 生成合成数据

为了欺骗鉴别器，生成器的目的是学习真实数据的分布并生成无法与真实数据区分开的合成数据。这里的一个问题是，对于相同的输入，它总是会产生相同的输出（想象一个图像生成器产生真实的图像，但总是相同的图像，这不是很有用）。这些图像生成和语言模型需要复杂的空间或时间复杂性，这增加了额外的复杂性，使读者更难理解

overfit同步小助手 2024-05-31 20:01:39 0 收藏

通过强化学习策略进行特征选择

在本文中，我们将介绍并实现一种新的通过强化学习策略的特征选择。

Deephub 2024-05-30 10:27:19 0 收藏

【机器学习】解锁AI密码：神经网络算法详解与前沿探索

随着人工智能技术的飞速发展，神经网络作为机器学习的一个重要分支，已经广泛应用于图像识别、自然语言处理、推荐系统等领域。神经网络通过模拟人脑神经元的连接方式，实现对复杂数据的处理和预测。本文将详细介绍神经网络的基本原理、结构、训练过程以及应用实例。

overfit同步小助手 2024-05-30 09:01:08 0 收藏

AI与程序员：合作开发让创新更有可能

在过去的几十年中，人工智能技术越来越受到广泛重视，并被广泛应用于各个领域。在软件开发行业中，人工智能技术也引起了极大的关注，成为许多企业和开发者的焦点。本文将探讨AI和程序员之间的合作关系，并表明其在软件开发中的主旨和意义。

overfit同步小助手 2024-05-29 15:01:47 0 收藏

人工智能热点跟踪：CVPR 2024热门研究领域分析

本文可视化分析了计算机视觉顶会CVPR 2024的研究热点，归纳和总结了热门研究方向，可以为读者追踪计算机视觉的研究热点提供一些有价值的参考。

overfit同步小助手 2024-05-29 10:01:24 0 收藏