机器学习中的数据级联:被低估的数据,被高估的模型
来自谷歌的研究员在一篇题为“Everyone wants to do the model work, not the data work”的论文中指出:数据质量在AI中起到的作用正在被低估,数据质量在高风险AI应用中十分重要
使用 TimeGAN 建模和生成时间序列数据
在本文中,我们将研究时间序列数据并探索一种生成合成时间序列数据的方法。
我总结了70篇论文的方法,帮你透彻理解神经网络的剪枝算法
神经网络剪枝是一种移除网络中性能良好但需要大量资源的多余部分的方法。
5个简单的步骤使用Pytorch进行文本摘要总结
在本文中,我们将演示如何在几个简单步骤中使用功能强大的模型轻松地总结文本。
在向量化NumPy数组上进行移动窗口操作
无论是摄影图片,地形,还是其他东西,都可以通过滑动窗口进行分析
用PyTorch和预训练的Transformers 创建问答系统
在本文中,我们将向您展示如何使用Huggingface Transformers库提供的预训练模型来实现问题解答。
使用遮挡分析进行DNN模型的可解释性说明概述
在这篇短文中,我将介绍一种基本的归因技术:遮挡分析
使用Scikit-Learn pipeline 减少ML项目的代码量并提高可读性
pipeline允许你封装所有的预处理步骤,特性选择,扩展,特性编码,最重要的是它帮助我们防止数据泄漏
使用Tensorflow模仿HearthArena炉石卡片排名算法
在这篇文章中,我将重新创造卡牌游戏《炉石传说》卡组制作工具的卡牌排名算法
GANs是如何创造出高分辨率的图像的
本文主要介绍DCGAN的适应渐进式增长创建高分辨率图像的思路
不使用直方图的6个原因以及应该使用哪个图替代
直方图并非没有偏见。实际上,它们是武断的,可能会导致对数据的错误结论。
从Wide and Deep、DeepFM到DLRM,现代的推荐系统算法研究
深入研究Facebook和谷歌等公司建立业务的人工智能算法。
谷歌新语言模型Switch Transformer
并非所有的知识一直都是有用的。 根据这个观点,谷歌大脑创建了新的Switch Transformer 。
有比Pandas 更好的替代吗?对比Vaex, Dask, PySpark, Modin 和Julia
数据科学有一个黄金法则。 如果数据能够完全载入内存(内存够大),请使用Pandas。 此规则现在仍然有效吗?
使用GCP开发带有强化学习功能的Roguelike游戏
强化学习(RL)的许多应用都是专门针对将人工从训练循环中脱离而设计的
低成本的二值神经网络介绍以及它能代替全精度网络吗?
人们越来越关注使模型更轻便,更高效,以便它们可以在边缘设备和移动设备上运行。减少深度神经网络的内存和计算成本的一种方法是二值神经网络
使用深度学习进行图像去噪
图像去噪是研究人员几十年来试图解决的一个经典问题,事实已经证明使用深度学习架构会更好的解决这个问题
5种数值评分标准总结 - 为预测模型找到正确的度量标准
在本文中,我们将描述数值预测模型的五个真实的用例并展示了计算它们的公式,总结了它们各自属性。
9个数据科学中常见距离度量总结以及优缺点概述
在本文中,我们将研究许多距离度量方法,并探讨如何以及何时最佳地使用它们。
图注意力网络入门:从数学理论到到NumPy实现
图神经网络(GNNs)已经成为学习图数据的标准工具箱。每个图节点从其邻居接收并聚合特征以表示局部图结构:不同类型的GNN层执行各种聚合策略。