5种搭建LLM服务的方法和代码示例

在这篇文章中,我们将总结5种搭建开源大语言模型服务的方法,每种都附带详细的操作步骤,以及各自的优缺点。

使用ORPO微调Llama 3

ORPO是一种新的微调技术,它将传统的监督微调和偏好对齐阶段结合到一个过程中。我们将使用ORPO和TRL库对新的Llama 3 8b模型进行微调。

掌握时间序列特征工程:常用特征总结与 Feature-engine 的应用

本文将通过使用feature-engine来简化这些特征的提取

RAG 2.0架构详解:构建端到端检索增强生成系统

当前RAG的问题在于各个子模块之间并没有完全协调,就像一个缝合怪一样,虽然能够工作但各部分并不和谐,所以我们这里介绍RAG 2.0的概念来解决这个问题。

PyTorch小技巧:使用Hook可视化网络层激活(各层输出)

这篇文章将演示如何可视化PyTorch激活层。可视化激活,即模型内各层的输出,对于理解深度神经网络如何处理视觉信息至关重要,这有助于诊断模型行为并激发改进。

ORPO偏好优化:性能和DPO一样好并且更简单的对齐方法

ORPO是另一种新的LLM对齐方法,这种方法甚至不需要SFT模型。通过ORPO,LLM可以同时学习回答指令和满足人类偏好。

时空图神经网络ST-GNN的概念以及Pytorch实现

对于时空图神经网络Spatail-Temporal Graph来说,最简单的描述就是在原来的Graph基础上增加了时间这一个维度,也就是说我们的Graph的节点特征是会随着时间而变化的。

Moirai:Salesforce的时间序列预测基础模型

在本文中,我们将探索用于时间序列预测的 Salesforce 新发布的基础模型 Moirai。最后我们还对比Moirai 与其他两个基础模型之间的差异

PiSSA :将模型原始权重进行奇异值分解的一种新的微调方法

我们开始看4月的新论文了,这是来自北京大学人工智能研究所、北京大学智能科学与技术学院的研究人员发布的Principal Singular Values and Singular Vectors Adaptation(PiSSA)方法。

AI推介-大语言模型LLMs论文速览(arXiv方向):2024.03.10-2024.03.15

因果推理通过捕捉变量之间的因果关系,在提高自然语言处理(NLP)模型的预测准确性、公平性、稳健性和可解释性方面显示出潜力。生成式大型语言模型(LLM)的出现极大地影响了各种 NLP 领域,尤其是通过其先进的推理能力。本调查侧重于从因果关系的角度评估和改进 LLM,主要涉及以下几个方面:了解和改进 L

【亚马逊云AI课程上新】「生成式 AI 精英速成计划」 即刻成为炙手可热 AI 人才

📌快速访问链接:本课程分为三个部分,带您了解如何使用大模型平台、如何训练与部署大模型及生成式AI产品应用与开发,您将能了解各类服务的优势、功能、典型使用案例、技术概念和成本。学习任选的两个课程模块,并通过测验者,将授予「技术开发技能」证书,展现您在生成式AI领域具备的技术开发能力。课程数: 5 ~

去中心化的 AI 数据供应:认识Grass,参与Grass

认识Grass,参与Grass。Grass对自己的产品定位,不仅仅是一个网络,更是一场数据民主化的运动,每个人都能分享AI革命的好处,共同参与构建AI数据层。

微软、OpenAI欲砸千亿美元打造AI超算 挑战“英伟达霸权”?

1000亿美元、百万AI芯片、5千兆瓦电力......星际之门(Stargate)蓝图曝光,堪称地表最强超算!据The infomation周五报道,微软和OpenAI正规划一个雄心勃勃的数据中心项目,建造一台名为“星际之门”的AI超级计算机。这个巨无霸超算将配备数百万专用AI芯片,旨在为OpenA

【UE】AI行为树入门——以小白人跟踪玩家并攻击为例

本篇文章要实现的效果是:小白人随机移动,并且在移动过程中如果看见了玩家,小白人就会跑向玩家,靠近玩家之后就会进行攻击。

10个大型语言模型(LLM)常见面试问题和答案解析

今天我们来总结以下大型语言模型面试中常问的问题

4大企业实例解析:为何MongoDB Atlas成为AI服务构建的首选

从药物研发、安全管理到SaaS、Voc,这些企业为何都选择MongoDB Atlas构建AI服务、降本增效?

人工智能|深度学习——基于Xception算法模型实现一个图像分类识别系统

在计算机视觉领域,图像识别是一个非常重要的任务,其应用涵盖了人脸识别、物体检测、场景理解等众多领域。随着深度学习技术的发展,深度卷积神经网络(Convolutional Neural Networks,简称CNN)在图像识别任务上取得了巨大成功,其中Xception算法作为一种改进型CNN,被广泛应

Python AI 之Stable-Diffusion-WebUI

通过Gradio库,实现Stable Diffusion web 管理接口。

【干货超全】国内外常见的Ai大模型汇总!!!

讯飞星火大模型由讯飞公司开发,采用了独特的融合计算框架,实现了语音与文本的深度融合,使对话更加自然流畅。它拥有超过1000亿参数,训练数据达到10000TB,覆盖了通用领域和垂直领域,可提供新闻聊天、心理咨询、医疗健康等服务。它的训练数据包括论文、新闻、社交媒体对话等,支持进行知识问答、文本创作、情

十二个AI工具集合网站大全

AIGC工具导航, AIGC即AI Generated Content,利用人工智能技术来生成内容,是继UGC、PGC之后的新型内容生产方式,而这个AIGC工具导航,是一个收集了全球1240+AI工具集合导航,种类非常多,包括AI搜索、AI写作、AI绘画、AI作曲、AI视频、AI剪辑、AI动画、AI