0


如何用正确的方式阅读和理解一篇机器学习论文

介绍

在这篇文章中,我们将回顾你在阅读机器学习论文时应该考虑的最重要的原则,以及作为机器学习工程师/从业者,你是否真的需要阅读论文来推进你的道路。

什么是论文?

论文是一篇书面的文章,但不是你可以在互联网博客上找到的文章,而是一篇关于学术文章。该文章将学术研究的结果外部化,并向读者提供所有必要的信息,以争论和揭示研究人员的发现。

科学论文的最终目的是增加知识领域,它作为书面媒介,通过它知识被正式表达、传播和被社会审查。最后一点很关键,已发布的论文都是是进行了审查、验证和评估能够保证其质量才能狗狗进行发布的。

一篇没有被评论和发表的论文被称为预印本,尽管它可能可以被阅读,你应该特别小心,用更批判性的眼光来阅读它。

一旦一篇论文准备发表,它将通过一篇社论来完成,并将其添加到科学杂志中。这是评估一个特定研究人员学术相关性的常用指标:他/她在著名杂志上发表了多少论文,以及他/她的论文被引用了多少次。最著名的杂志有《自然》、《细胞》、《通信ACM》、《科学》……

为了获得这些科学知识,有时你必须花钱,而且不是一笔小数目。通常,科学杂志最常见的读者是研究人员和大学。如果你现在正在这所大学学习,你可以向图书馆询问如何免费获取这些内容。

如果你不能自由地访问科学论文,你可以随时使用Sci-Hub :)。

最近,“开放获取”运动非常流行,其目标是每个人都可以免费访问论文,并且有诸如arXiv之类的文件存储库,其中包含数以千计的不同版本的pdf文件。请注意,在这里您只能找到预印本。

这些平台的目标是以一种更加灵活的方式传播科学知识,跳过验证过程中通常需要的等待时间。这是机器学习的关键之一,以及开放的文化,它让这个领域以近年来的速度发展。

简化科学论文阅读的关键

论文的结构

该结构通常在大多数论文中都很常见,但是在不同的研究领域中可能会有所不同。通常,一篇论文分为以下几个部分:

摘要:总结,作为文章内容的介绍。

简介:介绍要解决的问题。

相关工作:介绍论文所属的研究领域。获得相关书目的关键。

工具和方法:说明如何解决问题。在这里,我们将找到大多数公式,伪代码和实现细节。

实验和结果:包含图形,可视化文件和表格的部分

结论:研究结果总结

参考:从其他工作中获得的知识

随附文档:如果有一点需要进一步解释,会在这里进行详细解释。

如何阅读论文?

首先要做的是阅读摘要,以评估该主题是否对您感兴趣以及您是否想深入研究该主题。

然后,这取决于您要在该主题上投入多少时间或您对该主题的掌握程度。如果您不了解本文的研究领域,则可以专注于相关工作,这通常是主题化背景,结论和结果的关键。一旦研究人员已经具备一定的知识水平,他们通常会直接进行实验。

作为附件,下面引用的有关如何阅读论文的论文确实有用,它提出了有关如何阅读我个人经常使用的论文的策略,并为我大大简化了过程:

https://web.stanford.edu/class/cs244/papers/HowtoReadPaper.pdf

总之,它建议使用三个阅读阶段阅读任何给定的论文:

  • 首先阅读:摘要摘要,以评估您是否对论文感兴趣
  • 第二次阅读:这一步非常快,无需阅读公式或伪代码,也无需尝试理解所进行实验的所有演示。只需阅读导言和结论。
  • 三读:您将真正地研究上述所有部分,然后您应该能够重现所阅读的内容。

了解学术观点

尽管这一点有时很明显,但有必要强调一下。我们倾向于认为,作为科学文件的论文都是按照严格的方式生产的,它们遵循公认的惯例和方法,并且不会偏离事实很远。

机器学习是数学,语言学,计算机科学,信号处理等领域最广泛的科学领域之一,每个领域都有其独特的方法集。这意味着,在一篇论文中,从神经网络的层次结构来解释神经网络,在另一篇论文中,通过信号处理算法来解释,而在另一篇论文中,通过贝叶斯概率公式来解释。

为了完全理解一个主题,通常需要从所有角度进行分析,如果您想了解更多有关将问题概念化的特定方法(例如,贝叶斯概率),则应使用共享杂志或共享会议来复习出版物。通常有相似的观点。

搜索关于这份论文的意见和评论

寻求对论文的意见,学会批判。当您阅读一篇论文时,您应该记住,尽管它是一份通过了一些验证测试的文档,但这并不意味着它是一份防错误文档(特别是在阅读预印本时)。

保持批判的精神,随时问问自己你所读的内容是否正确:

  1. 这在方法论上可行吗?
  2. 结果是否被很好地呈现?
  3. 图表和可视化是否遵循良好的实践?
  4. 这篇论文解决了它提出的问题吗?
  5. 它与所用的术语是否一致?
  6. 这是调查的进展吗?或者这是一种更进步的进步,没有那么大的影响?

在写论文的时候,会产生许多好的和坏的习惯。一个非常有趣的资源是OpenReview网页,在这里,非常优秀的人公开发表评论,攻击那些没有足够严格和质量的作品。

在这一点上,我们还应该突出Yannic Kilcher的Youtube频道,这不仅使直接的评论最相关的论文,也通常补充他们个人的评价和意见为什么报纸可能不是正确的方法论上(从中可以学到很多东西)。

不(只是)阅读论文

在学习您感兴趣的主题时,不仅要阅读论文,多模式阅读,而且要去不同的来源。

就我个人而言,我不喜欢论文,我喜欢它们如何促进集体知识的增长,但是我不认为它们是传播知识的最合适方法,它们很难被消化并且读者必须(通常)要真正吸收他们提出的所有建议,需要付出巨大的努力。

除了大多数不是专门从事该领域研究的读者不需要对这些主题进行如此深入的研究外,在这个学习阶段中肯定有许多适合他们的资料来源。

其中一个例子是在机器学习领域存在的文章,能够做将复杂的内容变得容易理解和展现(例如配图),做到到通俗易懂才是关键。

我个人认为,论文是一种传播知识的工具,它并没有更新为21世纪可用的新资源。它们在学术环境中占有一席之地,但是对于大多数机器学习从业者而言,它们并不是必需的,并且通过互联网,我们找到了许多教学上极好的资源。

PapersWithCode列出了发布论文,并且包含与本文中引用的代码相关联的GitHub连接。所有这些都是扩展知识的好选择。

Distill.pub页面就是一个成功的例子,该页面除了非常清晰地介绍概念之外,还包含许多交互式元素,这些元素使访问此页面的任何读者都可以通过更易于访问的方式来访问知识。而且我们不会自欺欺人,这很酷。

最后,如果您真的想深入研究论文的内容,则可以始终与一些研究和准备论文内容的人员一起组成学习小组或研讨会,以讨论论文内容并提出有关要点的问题。尚不清楚。在学习某件事时,就某个话题分享您的观点并进行讨论是一个很好的资源。

作者:Victor Roman

原文地址:https://towardsdatascience.com/how-you-should-read-a-machine-learning-paper-28fd7943e210

deephub翻译组

标签:

“如何用正确的方式阅读和理解一篇机器学习论文”的评论:

还没有评论