Datawhale X 李宏毅苹果书 AI夏令营
阅读李宏毅老师苹果书及搭配视频的一次记录

CAS-ViT:用于高效移动应用的卷积加法自注意力视觉Transformer
这是8月份再arxiv上发布的新论文,我们下面一起来介绍这篇论文的重要贡献
Datawhale X 李宏毅苹果书 AI夏令营(Task2)
根据GPU是否可用选择设备类型# 初始化模型,并将其放置在指定的设备上# 定义批量大小# 定义训练轮数# 如果在'patience'轮中没有改进,则提前停止# 对于分类任务,我们使用交叉熵作为性能衡量标准# 初始化优化器,您可以自行调整一些超参数,如学习率。
【深度智能】:迈向高级时代的人工智能全景指南
本学习路线详细分解了人工智能学习过程中涉及的各个知识点,并通过具体案例对其进行了深入解析。学习者应从基础知识入手,逐步深入到机器学习和深度学习领域,再到高级应用、项目实践和前沿研究,持续学习和实践,不断提升自己的能力。
【AI大模型】ChatGPT模型原理介绍(下)
2020年5月, OpenAI发布了GPT-3, 同时发表了论文“Language Models are Few-Shot Learner”《小样本学习者的语言模型》.通过论文题目可以看出:GPT-3 不再去追求那种极致的不需要任何样本就可以表现很好的模型,而是考虑像人类的学习方式那样,仅仅使用极少
IsaacLab从入门到精通(三) 强化学习环境的创建
IsaacLab系列第三章,创建强化学习环境
如何预测足球比赛的胜平负进球数?也许我们可以这么做
预测足球比赛的进球数是一个复杂的任务,涉及到多种统计和机器学习方法。从泊松回归模型到Elo评分系统,再到蒙特卡罗模拟和现代的机器学习技术,每种方法都有其独特的优点和局限性。为了提高预测的准确性,在实际应用中,为了便利性,我们应当以AI技术为基底,整合并串联各项技术算法,以此确保系统的预测命中率,同时
人工智能、机器学习和深度学习有什么区别?应用领域有哪些?
人工智能、机器学习和深度学习有什么区别?应用领域有哪些?
[医疗 AI ] 3D TransUNet:通过 Vision Transformer 推进医学图像分割
医学图像分割在推进医疗保健系统的疾病诊断和治疗计划中起着至关重要的作用。U 形架构,俗称 U-Net,已被证明在各种医学图像分割任务中非常成功。然而,U-Net 基于卷积的操作本身限制了其有效建模远程依赖关系的能力。为了解决这些限制,研究人员转向了以其全局自我注意机制而闻名的 Transformer
Splitwise:使用相位分裂实现高效生成式 LLM 推理
24年5月来自华盛顿大学和微软的论文“Splitwise: Efficient Generative LLM Inference Using Phase Splitting”。
讲解基于图神经网络的情绪识别深度学习模型DGCNN(附基础原理讲解和代码讲解)
频谱图理论 (Spectral Graph Theory)是用线性代数概念(如特征向量和特征值理论)研究图的性质。(想要简单了解频谱图理论可以参考这个视频。DGCNN的基础是Chebynet。Chebynet是一种频谱图神经网络(Spectral GNNs)在频谱域中操作,具体指的是在图的拉普拉斯矩
self-attention(自注意力) 和 cross-attetion(交叉注意力) 中的差异
自注意力和交叉注意力的差异
【人工智能】九种神经网络模型
人工神经网络 (ANN) 是人工智能深度学习的一个基本概念。它们在处理传统机器学习算法难以处理的复杂应用场景方面至关重要。神经网络是解决复杂问题的强大工具。它们可以学习和适应数据,并且在各个行业都有广泛的应用。对于任何想要深化人工智能和深度学习技能的人来说,它们都是必不可少的。
秃姐学AI系列之:残差网络 ResNet
假如你只想在卷积神经网络了解一个网络,那一定是ResNet!!!
LSS (Lift, Splat, Shoot)论文精读
自动驾驶车辆的感知目标是从多个传感器中提取语义表示,并将这些表示融合到单一的“鸟瞰视图”坐标系中,供运动规划使用。我们提出了一种新的端到端架构,它可以直接从任意数量的相机图像数据中提取场景的鸟瞰视图表示。我们方法的核心思想是将每个图像单独“提升”到每个相机的特征锥体中,然后“涂抹”所有锥体到一个光栅
深度学习环境的配置
介绍:关于深度学习的框架有很多,比如国外的Pytorch,TensorFlow,Keras等等,国内的话例如百度的PaddlePaddle,华为的MindSpore。我们学习的以Pytorch为主,因为目前Pytorch是主流趋势,pytorch是动态框架,tensorflow是静态框架,动态框架可

MemLong: 基于记忆增强检索的长文本LLM生成方法
本文将介绍MemLong,这是一种创新的长文本语言模型生成方法。MemLong通过整合外部检索器来增强模型处理长上下文的能力,从而显著提升了大型语言模型(LLM)在长文本处理任务中的表现。
【AI大模型】ChatGPT模型原理介绍(上)
ChatGPT 是由人工智能研究实验室 OpenAI 在2022年11月30日发布的全新聊天机器人模型, 一款人工智能技术驱动的自然语言处理工具. 它能够通过学习和理解人类的语言来进行对话, 还能根据聊天的上下文进行互动, 真正像人类一样来聊天交流, 甚至能完成撰写邮件、视频脚本、文案、翻译、代码等
一文彻底搞懂 Fine-tuning - 超参数(Hyperparameter)
最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。
【爆火】TransUNet:融合Transformer与U-Net的医学图像分割神器!
在医学图像分割领域,传统的U-Net模型已经取得了显著成果。然而,随着Transformer在计算机视觉领域的崛起,将其与U-Net结合的TransUNet模型成为了新的热门。TransUNet是一种融合了Transformer和U-Net结构的深度学习模型,旨在提高医学图像分割的精度。它结合了Tr