语言模型 - overfit.cn

Docker Compose部署大语言模型LLaMa3+可视化UI界面Open WebUI

overfit同步小助手 2024-11-27 00:06:05 0 收藏

加入GitHub Spark需要申请

综上所述，GitHub Spark是一款由AI驱动的实验性工具，它通过自然语言生成代码的方式极大地降低了软件开发的门槛。GitHub Spark是一种由AI驱动的实验性工具，旨在帮助开发者快速实现创意，尤其是那些复杂但有趣的小型应用。它极大地降低了软件开发的门槛，使得即使是缺乏深厚编程专业知识的人也

overfit同步小助手 2024-11-26 19:03:35 0 收藏

掩码语言模型（Masked Language Model，简称MLM）

掩码语言模型（MLM）是一种自监督学习技术，它不需要显式的注释或标签，而是利用输入文本本身作为监督信号。在MLM任务中，输入文本的一部分单词会被随机掩盖（或替换为特殊的[MASK]标记），模型的目标是根据剩余的上下文信息来预测这些被掩盖的单词。这种机制迫使模型在训练过程中深入理解单词的上下文以及它们

overfit同步小助手 2024-11-26 13:01:25 0 收藏

OPT 大语言模型（Large Language Model）结构

大语言模型follow GPT的做法，其基本组成结构是Decoder-only的Transformer block，多个Transformer Block堆叠在一起；不同数量、不同Head、不同隐藏层维度构成了不同参数量的大模型（也即模型跟着的后缀，比如，6.7B）；预训练模型参数的数据类型（大模型

overfit同步小助手 2024-11-25 16:01:37 0 收藏

AI的三大支柱：神经网络、大数据与GPU计算的崛起之路

她在斯坦福大学的头几年，尽管遭遇了项目初期的冷淡反响，但通过ImageNet挑战赛吸引了广泛关注。该团队由李飞飞教授领导，他们的目标并不是改进神经网络，事实上，他们几乎没有考虑神经网络，而是致力于创建一个远大于以往的图像数据集：1400万张图像，每张都标注了约2.2万个类别之一。尽管有负面反馈，李飞

overfit同步小助手 2024-11-25 10:03:47 0 收藏

拥抱AI未来：Hugging Face平台使用指南与实战技巧

Huggingface总部位于纽约，是一家专注于自然语言处理、人工智能和分布式系统的创业公司。他们所提供的聊天机器人技术一直颇受欢迎，但更出名的是他们在NLP开源社区上的贡献。Huggingface一直致力于自然语言处理NLP技术的平民化(democratize)，希望每个人都能用上最先进(SOTA

overfit同步小助手 2024-11-25 09:01:23 0 收藏

Ollama：实现本地AI大语言模型命令行启动的专业部署方案

Ollama是一个强大的开源框架，专为在本地机器上便捷地部署和运行大型语言模型（LLM）而设计。

overfit同步小助手 2024-11-25 07:01:48 0 收藏

开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）

Ollama通过极大简化机器学习模型的下载和管理过程，降低了AI技术的入门门槛，为开发者和爱好者提供了便捷的本地运行环境，有助于保护数据隐私并促进创新与社区合作。

overfit同步小助手 2024-11-23 19:03:46 0 收藏

智体AI在多模态交互领域的综述（上）

24年1月论文“Agent AI: surveying the horizons of multimodal interaction“，来自斯坦福、微软、UCLA和华盛顿大学。

overfit同步小助手 2024-11-22 10:01:11 0 收藏

docker部署本地词向量模型

会先去下载 docker 镜像，然后运行容器。特别要强调的是：model 的路径可不是随便写的。在我的这个例子中，启动 docker 时，映射的路径是。，因此 model 的路径必须以/data 开头，不然的话是找不到模型的。，大家可以参考我的路径来调整 model 和 volume 变量的值。

overfit同步小助手 2024-11-21 20:01:39 0 收藏

开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama-历史消息记录管理（三）

使用`Message`参数明确用户意图，提高模型生成文本的相关性和准确性，确保输出符合特定对话风格或主题

overfit同步小助手 2024-11-19 08:04:00 0 收藏

【默子带读】Qwen2.5 最近的开源王炸模型（代码生成）

Qwen2.5是阿里巴巴发布的专注于代码生成、补全、错误修复和数学推理任务的开源模型。该系列模型涵盖了六种参数规模（从0.5B到32B），从轻量级应用到高性能推理，适配多样化的任务需求。模型架构基于Qwen系列的通用语言模型，但在多个关键任务上进行了优化，以更好地处理代码相关的生成与推理工作。💡凭

overfit同步小助手 2024-11-19 06:04:09 0 收藏

Open WebUI项目源码学习记录（从0开始基于纯CPU环境部署一个网页Chat服务）

学习开源项目Open WebUI过程中的一点笔记记录。通过本文，您可以了解：Open WebUI项目的基本信息和架构；通过ollama部署大模型、通过docker镜像和源码运行Open WebUI项目的方法；项目后端代码在多情景（普通提问、联网搜索提问、上传PDF文件且联网提问、上传PDF文件非联

overfit同步小助手 2024-11-18 11:04:34 0 收藏

探索 Meta AI 的多模态语言模型 Spirit LM：融合语音与文本的创新应用

Spirit LM 是 Meta AI 开发的多模态语言模型，无缝集成语音和文本数据，具备跨模态生成、语义表达和少量样本学习能力，应用于语音助手、ASR、TTS 等场景。

overfit同步小助手 2024-11-17 18:01:40 0 收藏

当下最热门的AI工具，你喜欢哪一款？

这些 AI 工具在各个领域中发挥着重要作用，不仅提高了效率和准确性，还带来了许多创新和便利。随着技术的不断进步，AI 工具的应用范围将进一步扩大，对社会和经济的影响也将更加深远。我相信总有一款工具能帮助到你。

overfit同步小助手 2024-11-16 12:01:49 0 收藏

搞人工智能开源大语言模型GPT2、Llama的正确姿势

目前我们每一小节的内容都讲解得非常慢，因为这是人工智能研发中的最基础知识。如果我们不能扎实掌握这些知识，将很难理解后续更复杂且实用的概念。因此，我们甚至采用一个概念一节的方式来编排内容，区分得清清楚楚、明明白白，以便大家能够非常明确地了解各知识点之间的关联关系和界限。本节将讲述一种在人工智能领域中被

overfit同步小助手 2024-11-15 19:01:14 0 收藏

南科大：中文安全数据基准ChineseSafe

如何评估大语言模型（LLM）在处理中文内容时的安全性？论文构建了一个名为ChineseSafe的中文基准数据集，用于全面评估LLM在中文场景中的安全性，并引入了三个新的安全问题类别。

overfit同步小助手 2024-11-15 13:06:40 0 收藏

【面试】解释一下什么是人工智能中的黑箱问题

1.1 什么是黑箱？在人工智能中，黑箱指的是那些内部机制对用户或开发者而言不可见或难以理解的系统或模型。对于黑箱模型，我们可以观察其输入和输出，但模型内部如何处理这些输入并得出输出的过程是复杂且不透明的。例如，一个深度神经网络在图像分类任务中，可以高效地将一张图像分类为“猫”或“狗”，但是人们很难解

overfit同步小助手 2024-11-14 21:01:10 0 收藏

大模型中文问答场景下的模型选择

C-MTP综合了标注数据和未标注数据，来自于多种来源，如Wudao语料库、科学文献、XLSUM-Zh、Wiki-Atomic-Edit、AmazonReviews-Zh等，确保了数据的大规模、多样性和质量。架构：BGE-Large-zh模型是基于BERT-like(类BERT)架构，特别是在特殊的[

overfit同步小助手 2024-11-14 20:01:20 0 收藏

大语言模型安全威胁

overfit同步小助手 2024-11-14 05:07:09 0 收藏