用随机游动生成时间序列的合成数据
随机游走是随机过程。 当没有可用信息或没有实时数据可用时,具有随机游走的合成数据可以近似实际数据。
9个value_counts()的小技巧,提高Pandas 数据分析效率
在本文中,我们将探讨 Pandas value_counts() 的不同用例。 我希望这篇文章能帮助你节省学习 Pandas 的时间。
机器学习是如何利用线性代数来解决数据问题的
为什么线性代数的基础知识如此重要
神经网络的多任务学习方法,避免灾难性遗忘
网络目前无法擅长一项以上的任务。你可以训练一个网络擅长某件事,但是一旦你试图教给网络其他东西,它就会忘记它在第一个任务中学到的东西。
如何阅读机器学习论文
我不会称自己为阅读论文的大师,但多年来通过反复的试验我有所进步。
机器学习中对抗性攻击的介绍和示例
让我们攻击机器学习模型,让他把猫识别成柠檬。
机器学习中的数据级联:被低估的数据,被高估的模型
来自谷歌的研究员在一篇题为“Everyone wants to do the model work, not the data work”的论文中指出:数据质量在AI中起到的作用正在被低估,数据质量在高风险AI应用中十分重要
使用 TimeGAN 建模和生成时间序列数据
在本文中,我们将研究时间序列数据并探索一种生成合成时间序列数据的方法。
我总结了70篇论文的方法,帮你透彻理解神经网络的剪枝算法
神经网络剪枝是一种移除网络中性能良好但需要大量资源的多余部分的方法。
5个简单的步骤使用Pytorch进行文本摘要总结
在本文中,我们将演示如何在几个简单步骤中使用功能强大的模型轻松地总结文本。
在向量化NumPy数组上进行移动窗口操作
无论是摄影图片,地形,还是其他东西,都可以通过滑动窗口进行分析
用PyTorch和预训练的Transformers 创建问答系统
在本文中,我们将向您展示如何使用Huggingface Transformers库提供的预训练模型来实现问题解答。
使用遮挡分析进行DNN模型的可解释性说明概述
在这篇短文中,我将介绍一种基本的归因技术:遮挡分析
使用Scikit-Learn pipeline 减少ML项目的代码量并提高可读性
pipeline允许你封装所有的预处理步骤,特性选择,扩展,特性编码,最重要的是它帮助我们防止数据泄漏
使用Tensorflow模仿HearthArena炉石卡片排名算法
在这篇文章中,我将重新创造卡牌游戏《炉石传说》卡组制作工具的卡牌排名算法
GANs是如何创造出高分辨率的图像的
本文主要介绍DCGAN的适应渐进式增长创建高分辨率图像的思路
不使用直方图的6个原因以及应该使用哪个图替代
直方图并非没有偏见。实际上,它们是武断的,可能会导致对数据的错误结论。
从Wide and Deep、DeepFM到DLRM,现代的推荐系统算法研究
深入研究Facebook和谷歌等公司建立业务的人工智能算法。
谷歌新语言模型Switch Transformer
并非所有的知识一直都是有用的。 根据这个观点,谷歌大脑创建了新的Switch Transformer 。
有比Pandas 更好的替代吗?对比Vaex, Dask, PySpark, Modin 和Julia
数据科学有一个黄金法则。 如果数据能够完全载入内存(内存够大),请使用Pandas。 此规则现在仍然有效吗?