Linux系统安装多个CUDA版本与切换,正常AI模型训练
如果已经安装了NVIDIA驱动版本,先卸载旧驱动,再安装新CUDA对应的驱动,如果没有安装过NVIDIA驱动版本,可以直接安装新CUDA版本,它会自动安装对应的NVIDIA驱动。(2)执行nvidia-smi命令,显示是cuda的版本号(每个cuda版本对应了不同驱动版本),提供有关系统中NVIDI
AI芯片:高性能卷积计算中的数据复用
随着深度学习的飞速发展,对处理器的性能要求也变得越来越高,随之涌现出了很多针对神经网络加速设计的AI芯片。卷积计算是神经网络中最重要的一类计算,本文分析了高性能卷积计算中的数据复用,这是AI芯片设计中需要优化的重点之一,具体思路如下:1.数据复用的动机2.存储-计算分离框架下,针对卷积计算的优化思路
Dify 与 Xinference 最佳组合 GPU 环境部署全流程
在前一篇文章RAG 项目对比之后,确定 Dify 目前最合适的 RAG 框架。本次就尝试在本地 GPU 设备上部署 Dify 服务。Dify 是将模型的加载独立出去的,因此需要选择合适的模型加载框架。调研一番之后选择了Xinference支持多种类型的模型,包括 LLM,Embedding, Rer
Mem0:LLM个性化、陪伴式开源框架
Mem0 的 LLM 记忆实现方法与检索增强生成 (RAG) 等传统方法相比具有明显优势。与从静态文档中检索信息的 RAG 不同,Mem0 的记忆层可以理解和关联不同交互中的实体,保持上下文连续性并优先考虑相关的最新信息。这种动态更新功能可确保记忆保持最新状态,从而提供针对单个用户交互量身定制的准确
本地部署graphGAG--pip和初始化存在的问题
GraphRAG(Graph-based Retrieval-Augmented Generation)是一种结合了知识图谱和图机器学习技术的新型检索增强生成模型。它由微软于2024年7月2日开源,旨在显著提升大型语言模型(LLM)在处理私有数据时的理解和推理能力。对大模型完全陌生的实习小白上手记录
AWQ量化及AutoAWQ代码详解
awq论文解读及autoawq源码分析
Github项目:AI消除马赛克实战,墙都不扶就服你
1、原理====该算法利用线性盒滤波器分别处理每个块的事实。对于每个块,它将搜索图像中的所有块像素化以检查直接匹配。对于大多数像素化图像,Depix能够找到单个匹配结果。它假设这些是正确的。然后将周围多个匹配块的匹配在几何上与像素化图像中相同的距离进行比较。匹配也被视为正确。这个过程重复几次。当正确
嵌入式人工智能(OpenCV-基于树莓派的人脸识别与入侵检测)
Mediapipe 由 Google Research 于 2020 年推出,旨在为计算机视觉研究人员和开发者提供一个易于使用、高性能的框架。Mediapipe 提供了多种预训练模型和算法,涵盖了人脸检测、手势识别、姿态估计等领域。
【学术会议征稿】2024年智能医疗与可穿戴智能设备国际学术会议
本次会议主要围绕“智能医疗与可穿戴智能设备”的最新研究展开,旨在荟聚世界各地该领域的专家、学者、研究人员及相关从业人员,分享研究成果,探索热点问题,交流新的经验和技术。我们热烈欢迎相关领域专家学者向SHWID 2024提交他们的新研究或技术贡献,与来自世界各地的科学家和学者分享宝贵的经验.欢迎海内外
Pytorch基础:Tensor的连续性
在Pytorch中,一个连续的张量指的是张量中各数据元素在底层的存储顺序与其在张量中的位置一致。这意味着每一个元素的地址可以通过下面的线性映射公式来确定:
24小时监控识别潜在的非安全生产隐患的明厨亮灶开源了。
明厨亮灶视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程,实现芯片、算法、应用的全流程组合,从而大大减少企业级应用约95%的开发成本。AI技术可以24小时监控识别潜在的非安全生产隐患,大大减少监控室人员的需求。监控室的班
AI:12-基于深度学习的人脸识别研究
人脸识别技术作为一种先进的生物特征识别技术,在各个领域展示了广泛的应用前景。本文基于深度学习的人脸识别签到系统进行了深入研究,通过使用卷积神经网络(CNN)和面部特征提取技术,实现了准确的人脸识别和自动签到功能。同时,为了提高系统性能和效率,优化了模型架构、数据预处理和模型调优等方面。通过代码实现和
从零实现强化学习RLHF代码(PPO、RLOO)
从零开始实现强化学习代码
顶级10大AI测试工具
使用人工智能进行应用测试是一种新的有前景的方法,它可以减少测试准备和执行的时间,提高软件质量,并预测可能的问题。利用本文描述的AI测试自动化工具,在测试过程中应用AI以改进工作。
AI多模态教程:Qwen-VL多模态大模型实践指南
使用官方项目里提供的微调脚本进行LoRA微调测试,模型采用HuggingFace下载的那个全精度模型,数据采用上面的示例数据,建议模型路径使用绝对路径,如果你想节省显存占用,可以考虑使用chat模型进行LoRA微调,显存占用将大幅度降低。提供finetune.py脚本和shell脚本的目的是为了简化
NsightCompute教程入门
使用pycuda 获取显卡的性能手动绘制rootline model.nsight system 安装教程nsight system 使用教程–nsight system 分析pytorch 神经网络nsight compute 安装教程nsight compute 使用教程nsight syste
医学图像分割的基准:TransUnet(用于医学图像分割的Transformer编码器)器官分割
TransUnet是一种用于医学图像分割的深度学习模型。它是基于Transformer模型的图像分割方法,由AI研究公司Hugging Face在2021年提出。医学图像分割是一项重要的任务,旨在将医学图像中的不同结构和区域分离出来,以便医生可以更好地诊断和治疗疾病。传统的医学图像分割方法通常使用基
rfid在身份识别的应用
这样的场景化定制和个性化服务能够提升用户体验和满意度,进一步推动RFID技术在身份识别领域的应用和发展。传统的RFID标签容易受到非法读取和复制的风险,因此,需要采用先进的加密技术和安全协议来保护用户的隐私和数据安全。通过不断探索和创新新的技术手段和应用模式,我们可以充分发挥RFID技术的优势,为身
MCR DIMM如何解决内存带宽瓶颈?
随着云计算、大数据、人工智能(AI)和高性能计算(HPC)等领域对内存带宽的迫切需求,存储技术的创新显得尤为重要。在这个背景下,MCR DIMM(Multiplexer Combined Ranks DIMM)应运而生,成为解决内存带宽瓶颈的关键技术之一。随着处理器核心数的不断增加,为处理器提供足够
AI智能技术驱动安全生产:智慧矿山视频智能监管新篇章
当识别到有人员未按照要求穿戴安全帽、反光背心/工服时,将立即抓拍,并将告警信息上传到平台。