语言模型 - overfit.cn

大语言模型系列-GPT-3.5(ChatGPT)

语言模型更大并不能从本质上使它们更好地遵循用户的意图，大型语言模型可能生成不真实、有害或对用户毫无帮助的输出。GPT-3.5正是基于此问题进行的改进，它通过对人类反馈进行微调，使语言模型与用户在广泛任务中的意图保持一致，专业术语是对齐（Alignment）。ps：ChatGPT和InstructGP

overfit同步小助手 2024-03-08 14:04:15 0 收藏

第四章：AI大模型的主流框架 4.4 MXNet

1. 背景介绍随着深度学习技术的快速发展，越来越多的研究者和工程师开始关注深度学习框架。深度学习框架是一种软件库，它可以帮助我们更轻松地设计、训练和部署深度学习模型。目前市面上有很多优秀的深度学习框架，如TensorFlow、PyTorch、Caffe等。本文将重点介绍MXNet，一种高效、灵活且易

overfit同步小助手 2024-03-07 00:01:11 0 收藏

开源语音大语言模型来了！阿里基于Qwen-Chat提出Qwen-Audio!

大型语言模型（LLMs）由于其良好的知识保留能力、复杂的推理和解决问题能力，在通用人工智能（AGI）领域取得了重大进展。

overfit同步小助手 2024-03-06 03:04:03 0 收藏

Meta开源大模型LLaMA2的部署使用

Llama2开源且免费用于研究和商业用途，接受2万亿个标记的训练，上下文长度是Llama1的两倍。Llama2包含了70亿、130亿和700亿参数的模型。

overfit同步小助手 2024-03-05 14:04:26 0 收藏

从AI推理性能优化角度看LLaMA的模型结构和源码

几个月前，FB开源了LLAMA，LLAMA1包括三个参数量的模型7B、13B、65B，证明了完全可以通过公开数据集来训练最先进的模型，而无需使用专有和不可获取的数据集，同时LLaMA-13B 在大多数benchmark优于 GPT-3，尽管大小只有后者的1/10。在更大规模上，LLaMA-65B

overfit同步小助手 2024-03-05 09:01:21 0 收藏

AI Coding Assistant 智能编程助手方案指标对比

前端： HTML、JavaScript、CSS、Less、swan、San、Vue、Scss、Sass、Stylus、pug、mermaid。基于智能生成、智能问答2大核心能力，覆盖代码生成、研发知识问答、单元测试用例生成、代码解释、代码注释、代码翻译、代码调试、代码检查等八大研发场景。支持注释生成

overfit同步小助手 2024-03-04 17:01:19 0 收藏

Cohere For AI 推出了 Aya，这是一款覆盖超过 100 种语言的大型语言模型（LLM）

Cohere For AI 的研究团队，也就是 Cohere 的非营利性研究实验室 C4AI，今日宣布了一项激动人心的进展：推出了一款名为 Aya 的全新、开源、大规模多语言生成式大型语言模型（LLM），覆盖超过 101 种语言。这一跨越性的创举，使得 Aya 的语言覆盖范围是现有开源模型的两倍多，

overfit同步小助手 2024-03-02 21:01:45 0 收藏

ChatGPT丨“成像光谱遥感技术中的AI革命：ChatGPT应用指南“

光谱遥感、AI人工智能、ChatGPT、遥感数据处理、数据分析、预测建模、卫星图像、摄影侦察、GEE、python、envi、遥感影像处理、机器学习

overfit同步小助手 2024-03-02 20:01:41 0 收藏

最强开源模型 Mixtral-8x7B-Instruct-v0.1 详细介绍：稀疏 Mixtral of experts

同样，在推理过程中，假设每个令牌仅使用两名专家，推理速度 (FLOP) 就像使用 12B 模型（而不是 14B 模型），因为它计算 2x7B 矩阵乘法，但共享一些层。然后，输入的信息将以最高的概率发送给专家，确保最合适的专家处理手头的任务。C) 另请注意，虽然有推理服务，但实现了 FP8 实现，每个

overfit同步小助手 2024-03-01 19:04:07 0 收藏

AI大模型应用入门实战与进阶：6. 图像识别大模型的实战与进阶

1.背景介绍图像识别是人工智能领域的一个重要分支，它涉及到计算机视觉、深度学习、机器学习等多个领域的知识和技术。随着数据量的增加和计算能力的提升，图像识别大模型的应用也逐渐成为了人工智能领域的一个热点话题。本文将从以下几个方面进行阐述：1.1 图像识别大模型的发展历程1.2 图像识别大模型的应用场景

overfit同步小助手 2024-03-01 17:01:31 0 收藏

【AI大语言模型】ChatGPT在地学、GIS、气象、农业、生态、环境等领域中的应用

AI大模型、地学、GIS、气象、农业、生态、环境、思维导图、数据清洗、统计分析、高级编程、代码调试、算法学习、论文检索、写作、翻译、润色、文献辅助阅读、文献信息提取、辅助论文审稿、新闻撰写、科技绘图、地学绘图（GIS地图绘制）、概念图生成、图像识别、机器/深度学习

overfit同步小助手 2024-03-01 15:01:40 0 收藏

Mistral AI 的大语言模型怎么样？

对用户来说，更多的选择没坏处；如果这个选择本身还很优质，那就更棒了。对话早上，我收到了 Mistral 发来的邮件，提示我拥有了访问 Le Chat 的权限。我一时觉得很奇怪，什么是 Le Chat？然后我才弄明白，原来是 Mistral 对标 ChatGPT ，推出了一个自己的对话机器人界面。虽然

overfit同步小助手 2024-03-01 05:01:29 0 收藏

WhisperFusion：具有超低延迟无缝对话功能的AI系统

WhisperFusion 基于 WhisperLive 和 WhisperSpeech 的功能而构建，在实时语音到文本管道之上集成了大型语言模型 Mistral (LLM)。

overfit同步小助手 2024-02-29 23:01:39 0 收藏

清华系面壁MiniCPM：国产AI模型新突破，2B小钢炮成本效率双优

在人工智能的快速发展中，模型的规模和性能成为衡量先进技术的关键指标。最近，清华系创业团队面壁智能发布的面壁MiniCPM模型，以其2B（24亿）参数的“小钢炮”身份，成功挑战了70亿参数的国际大模型Mistral-7B，实现了在多项AI评测中的领先成绩。

overfit同步小助手 2024-02-28 20:01:39 0 收藏

第二章：AI大模型的基础知识2.3 自然语言处理基础2.3.1 词向量表示

在本篇博客文章中，我们将深入探讨自然语言处理（NLP）领域的一个重要概念：词向量表示。我们将从背景介绍开始，然后讲解核心概念与联系，接着详细解析核心算法原理、具体操作步骤以及数学模型公式。在此基础上，我们将提供具体的代码实例和详细解释说明，以及实际应用场景。最后，我们将推荐一些工具和资源，并总结未来

overfit同步小助手 2024-02-28 15:01:35 0 收藏

第一章：AI大模型概述1.1 AI大模型的定义与特点1.1.1 什么是AI大模型

1.背景介绍AI大模型是指具有极大规模、高度复杂结构和强大计算能力的人工智能模型。这类模型通常用于处理大规模、高维度的数据，并能够实现复杂的智能任务，如自然语言处理、图像识别、推荐系统等。AI大模型的发展与人工智能领域的进步紧密相连，它们共同推动了各种新的应用和技术创新。1.1 人工智能的发展历程

overfit同步小助手 2024-02-25 06:01:26 0 收藏

各种AI的调试日记——辅助工作篇

记录使用各种AI（语言大模型）的心得和总结

overfit同步小助手 2024-02-25 04:01:35 0 收藏

第四章：AI大模型的主流框架 4.3 Keras

1.背景介绍1. 背景介绍Keras是一个开源的深度学习框架，基于Python编写，可以用于构建和训练神经网络。它简单易用，具有高度可扩展性，可以与其他深度学习框架（如TensorFlow、Theano和CNTK）一起工作。Keras被广泛应用于图像识别、自然语言处理、语音识别等领域。Ker

overfit同步小助手 2024-02-25 02:01:41 0 收藏

香港科技园公司董事车品觉：探秘大数据背后的大语言模型世界

大数据产业创新服务媒体——聚焦数据· 改变商业在数字时代的大舞台上，大数据与大语言模型的交汇如同星辰般璀璨，勾勒出创新之路的奇妙轨迹。这两者的完美契合不仅是科技领域的巨大突破，更是创新之路的重要交汇点。作为大数据领域的一位先锋者，香港科技园公司董事、太平绅士、香港特区政府数字经济发展委员会委员车品觉

overfit同步小助手 2024-02-24 05:03:39 0 收藏

AI时代，普通人如何借势？

算法和人工智能是如何影响我们的生活的？本书便是在这种背景下诞生的，它告诉我们应该如何正确看待数字技术，人工智能时代里我们的优势是什么，以此我们提供掌控自己生活的策略和方法，以避免被人工智能掌控。格尔德·吉仁泽提出的“稳定世界原则”好像帮我们理解人工智能提供了一个新的视角，在了解了AI 的这个特点后，

overfit同步小助手 2024-02-23 21:01:44 0 收藏