【人工智能】LLM 大型语言模型和 Transformer 架构简介

然而,传统的机器学习模型,例如神经网络,并不能天生理解输入的顺序。通过将位置编码纳入 Transformer 架构,GPT 可以更有效地理解句子中单词的顺序,并生成语法正确且语义有意义的输出。但是,模型只能理解数字,不能理解文本,因此需要将这些输入转换为称为“输入嵌入”的数字格式。作为初创公司的首席

【人工智能的数学基础】瑞利商(Rayleigh Quotient)和广义(Generalized)瑞利商

对于一个Hermitan矩阵AAA(复域的共轭对称矩阵,满足AHAA^H=AAHA)及非零向量xx1xnTxx1​...xn​TRAxxHAxxHxRAxxHxxHAx​其中xHx^HxH是xxx的共轭转置向量。

Python自然语言处理:NLTK入门指南

自然语言处理(Natural Language Processing,NLP)是指计算机处理人类语言的领域。它是一门多学科交叉的学科,将计算机科学、人工智能、语言学等诸多学科的理论和方法融合在一起,将人类语言转化为计算机所能理解的形式,实现对人类语言的自动处理、理解和生成。NLP可以应用到很多方面,

【人工智能概论】 K折交叉验证

K折交叉验证

【人工智能】企业如何使用 AI与人工智能的定义、研究价值、发展阶段的深刻讨论

企业如何使用 AI与人工智能的定义、研究价值、发展阶段的深刻讨论定义详解研究价值发展阶段企业如何使用 AI?科学介绍

LQR算法原理和代码实现

本文讲解线性二次优化器LQR的原理和C++的代码实现,同时在CARLA-ROS联合仿真环境验证算法效果。

【AI人工智能】适用于个人和企业的机器学习、数据科学和人工智能 (AI) 术语库

人工智能是一系列概念和技术的总称,这些概念和技术允许机器展示类似人类的能力。一些常见的实现包括自动驾驶汽车、模拟人类的聊天机器人和面部识别应用程序。最近的一些突破已经导致应用程序不仅模仿人类智能,而且远远超越,执行人类不可能完成的任务。人工智能可以追溯到 1950 年代,经历了几个繁荣和萧条周期。1

【人工智能的数学基础】函数的光滑化(Smoothing)

综上所述,需要对非光滑函数进行光滑近似的方法。本文首先对函数的光滑化进行定义,并介绍几种对函数进行光滑化的方法。光滑函数(smooth function)是指在其定义域内无穷阶数连续可导的函数。函数的光滑化是指对于一个非光滑函数fff,寻找一个光滑函数fμf_{\mu}fμ​,使得fμf_{\mu}

WGAN-GP解读分析

WGAN-GP(Wasserstein GAN with gradient penalty)相比GAN(Generative Adversarial Network)有以下几个优点:更好的损失函数:WGAN-GP使用了Wasserstein距离来度量生成器和判别器之间的距离,相比于GAN中使用的交叉

线性规划问题

线性规划是最优化问题的一种特殊情形,实质是从多个变量中选取一组合适的变量作为解,使得这组变量满足一组确定的线性式(约束条件),而且使一个线性函数(目标函数)达到最优。线性规划顾名思义,由两个关键的部分组成:线性和规划。

时间序列的重采样和pandas的resample方法介绍

重采样是时间序列分析中处理时序数据的一项基本技术。它是关于将时间序列数据从一个频率转换到另一个频率,它可以更改数据的时间间隔,通过上采样增加粒度,或通过下采样减少粒度。

模型评估:可决系数与纳什效率系数

模型评估:可决系数与纳什效率系数

数学建模 | 关于季节性ARIMA模型你必须知道的20个知识点

同ARIMA模型,时间序列趋势的变化会对SARIMA模型建立的短期相关模型产生较大影响,预测效果下降。时间序列的值随时间变化,且经差分后过去的观测值与未来值以及对应季节的数据之间存在较强的相关性。SARIMA模型是ARIMA模型的扩展,可以对存在季节性周期变化的时间序列进行建模和预测。首先确定最优的

机器学习——先验概率、后验概率、全概率公式、贝叶斯公式

先验概率(prior probability)是指根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现的概率。后验概率是指在得到“结果”的信息后重新修正的概率,是“执果寻因”问题中的"果"。贝叶斯公式就是当已知结果,问导致这个结果的第 i 原因的可能性是多少。

机器学习(周志华)课后习题

机器学习记录

delta method 介绍

众所周知,当一个变量X服从正态分布时,其线性变换也服从正态分布。那么非线性变换呢?delta方法提出,其经过可导函数变换后得到的g(X)仍然概率趋向正态分布,并且提供了期望、方差的计算公式。单变量X变换为g(X),对g(X)g(X)≈g(θ)+g′(θ)(X−θ)g(X)−g(θ)≈g′(θ)(X−

【人工智能的数学基础】函数的光滑化(Smoothing)

综上所述,需要对非光滑函数进行光滑近似的方法。本文首先对函数的光滑化进行定义,并介绍几种对函数进行光滑化的方法。光滑函数(smooth function)是指在其定义域内无穷阶数连续可导的函数。函数的光滑化是指对于一个非光滑函数fff,寻找一个光滑函数fμf_{\mu}fμ​,使得fμf_{\mu}

Sam Altman 最新访谈:谈谈 AI 的未来,还有中国 AI 发展现状

在经历了数论关于AI监管的对谈和磋商后,最近很少发声的 Sam Altman 又一次接受了新访谈,5月9日,在一场Sohn 2023活动的对谈中,OpenAI的CEO 对大语言模型和AI的未来,监管的方式,竞争对手和中国AI发展及AI领域的创投机会都表达了他新一轮,更成熟更系统化的思考。在一个月之前

Python中进行特征重要性分析的9个常用方法

特征重要性分析用于了解每个特征(变量或输入)对于做出预测的有用性或价值。目标是确定对模型输出影响最大的最重要的特征,它是机器学习中经常使用的一种方法。

Proximal Policy Optimization(近端策略优化)(PPO)原理详解

PPO主要是针对Important-Sampling产生的不稳定性进行了CLIP操作和罚函数法,相比TRPO方法更简单容易实现,有了策略梯度的定义,可以结合其他Actor-Critic进行联合使用更新,并且PPO将策略梯度缺陷的on-policy变为了off-policy,更大可能的利用了采样样本,