开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-tool usage入门-集成心知天气(二)

使用Qwen-Agent 集成心知天气获取实时天气信息

开源模型应用落地-glm模型小试-glm-4-9b-chat-Gradio集成(三)

使用Gradio提供的友好界面,让开发者和用户能够直观地与GLM-4-9B-Chat模型进行交互。

开源模型应用落地-glm模型小试-glm-4-9b-chat-vLLM集成(四)

GLM-4-9B-Chat集成vLLM,实现推理加速

剪枝技术在边缘计算安全中的角色

剪枝技术在边缘计算安全中的角色关键词:剪枝(Pruning)边缘计算(Edge Computing)安全(Security)深度学习(Deep Learning)模型优化

【AI-20】训练服务器和推理服务器

(一)任务排队与优先级管理。(二)性能监控与优化。(三)便于管理和维护。

开源模型应用落地-glm模型小试-glm-4-9b-chat-快速体验(一)

GLM-4-9B-Chat 是智谱 AI 推出的对话版本模型,具备多轮对话能力、长文本推理(支持最大128K上下文)、网页浏览、代码执行和自定义工具调用等高级功能,性能接近领先模型如 GPT-4,适用于在线客服和教育等领域。

机器学习和深度学习中的logit

logit 值是模型在最后一层的原始输出值,未经过激活函数处理。例如,本例中的 logit 值为0.50.342.410.50.342.41。logit 值可以通过Softmax 函数转换为概率分布,用于分类任务。通过计算,最终概率分布为0.1160.0990.7850.1160.0990.785,

丹摩征文活动 | SD3+ComfyUI模型图文部署:AI工程师的实践与探索

在丹摩智算平台上部署SD3+ComfyUI图文模型的过程中,我感受到了极高的效率和便捷性,尤其是在处理图文生成任务时表现尤为出色。作为一名AI工程师,我对平台的计算能力和操作简便性有着严格的要求,而丹摩智算正好满足了这些需求。丹摩智算平台的界面用户友好,功能布局合理,使得整个部署过程非常直观。即使是

【大数据分析&深度学习】在Hadoop上实现分布式深度学习

本文介绍大数据和深度学习结合之路,即在Hadoop上实现分布式深度学习。主要讲解三个框架,包括Submarine(Hadoop生态系统),TonY(LinkedIn)和DL4J(deeplearning4j)。

人工智能-深度学习-学习笔记

人工智能当前的发展呈现出加速和深化的趋势,特别是在深度学习领域。技术革新与应用拓展并行推进,深度学习算法和模型结构不断创新,为处理复杂数据提供了强有力的工具,使得AI在图像识别、语音处理、自然语言理解等方面取得显著进展,并广泛应用于金融、医疗、教育、交通等多个行业。同时,数据驱动和算力提升成为AI发

Microsoft Cognitive Toolkit (CNTK): 开源深度学习框架

Microsoft Cognitive Toolkit (CNTK) 是由微软研究院开发的开源深度学习框架。它通过有向图来描述神经网络,将神经网络表示为一系列计算步骤。CNTK 允许用户轻松实现和组合各种流行的模型类型,如前馈 DNN、卷积网络 (CNN) 和循环网络 (RNN/LSTM)。它实现了

开源模型应用落地-业务优化篇(二)

在业务整合之后,我们将把注意力转向非功能性需求。接下来,我将逐步向您介绍如何发现系统的性能瓶颈,并通过技术优化来提高系统的各项性能指标。

OPT 大语言模型(Large Language Model)结构

大语言模型follow GPT的做法,其基本组成结构是Decoder-only的Transformer block,多个Transformer Block堆叠在一起;不同数量、不同Head、不同隐藏层维度构成了不同参数量的大模型(也即模型跟着的后缀,比如,6.7B);预训练模型参数的数据类型(大模型

开源模型应用落地-Qwen2.5-7B-Instruct与TGI实现推理加速

集成 Hugging Face的TGI框架实现模型推理加速

AI 翻唱

So-vits-svc 4.1 训练模型全过程。UVR:用于人声歌声分离,降噪。Slicer-gui(Audio-Slicer):用于音频裁剪。So-vits-svc 4.1:训练模型。Adobe Audition:后期音频编辑。

Linux 系统上部署 RabbitMQ

在 Linux 系统上部署 RabbitMQ(一个开源的消息代理)通常包括安装 Erlang(RabbitMQ 的依赖)和 RabbitMQ 本身,并进行基本的配置。以下是一个详细的步骤指南,帮助你在 Linux 上成功部署 RabbitMQ。

IoU已经out了,试试这几个变体:GIoU、DIoU和CIoU介绍与对比分析

GIoU、DIoU和CIoU这三个变体都有各自的独到之处,它们在一定程度上弥补了普通IoU在处理不重叠、距离较远或形状差异较大的边界框时的不足。

Vllm进行Qwen2-vl部署(包含单卡多卡部署及爬虫请求)

使用vLLM部署Qwen2-VL,包含单卡部署、多卡部署、爬虫requests发送请求

开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama(一)

Ollama通过极大简化机器学习模型的下载和管理过程,降低了AI技术的入门门槛,为开发者和爱好者提供了便捷的本地运行环境,有助于保护数据隐私并促进创新与社区合作。

AI4Science(2024年4月总结):物理驱动及数据驱动深度学习方法用于科学计算问题

本文主要介绍,用于科学计算问题中的物理驱动和数据驱动的深度学习方法。通过方法算例,对现有方法总结。时间是2024年4月。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈