0


使用Tensorboard投影进行高维向量的可视化

Tensorflow是最受欢迎的免费开放源代码机器学习库之一,可帮助您执行各种机器学习和深度学习项目。它可以用于各种任务,包括训练,推理,可视化ML和DL模型。它还提供了各种各样的预训练模型。

TensorBoard是tensorflow的可视化工具包。它帮助我们可视化各种机器学习实验。

我们可以用TensorBoard做什么?

  • TB可以帮助我们追踪各种指标,例如机器学习训练的损失和准确性。
  • 模型图可以可视化。
  • 我们可以查看权重,偏差或其他张量的直方图。
  • 将高维嵌入图绘制到低维空间。可视化并理解它
  • 显示图像,文本和音频数据
  • 等等

如标题中所述,我们将专注于将Tensorboard嵌入式投影用于我们自己的用例以及我们自己的特征向量。

在此之前,我们来看一些词嵌入和图像特征向量的可视化示例。

Word2Vec嵌入示例

MNIST

您可以通过两种方式将projector与TB一起使用。

直接上传特征向量

使用这里加载按钮直接上传。

要加载要可视化的数据,我们必须了解加载数据的格式。为了可视化,需要以tsv格式上传特征向量。每行代表一个特征向量,并以'\ t'空格分隔。然后还必须以tsv格式添加元数据。特征向量和标签的顺序应与其映射标签以进行可视化的顺序相同。如果你也要提供该类,则在元数据中以制表符分隔的列中,可以指定该类。但是如果添加两列,则必须添加列名称。

使用代码

使用tensorboard在本地计算机上嵌入投影仪,首先需要安装tensorflow。

现在,您需要导入和加载必要的程序包和扩展。

在这里,我们导入tensorboard扩展。之后,我们从tensorflow.plugins加载projector。

然后设置一个日志目录,以便Tensorboard知道在哪里查找文件。

这个例子需要metadata.tsv和features.txt(txt格式的向量)。您可以根据自己的喜好选择两者。

在这里,我正在创建一个名为test和inside 的日志目录,使用已经创建的metadata.tsv,其中包含元数据和features.txt,其中包含特征向量。对于元数据,它与上述情况相同。但是对于features.txt,我只是将每个功能附加到列表中,并使用np.savetxt函数将其保存。

最后需要使用以下命令运行TB,就完成了

如果想直接访问TB,可以使用浏览器打开localhost:6006。

作者:

原文地址:https://medium.com/analytics-vidhya/tensorboard-embedding-projector-visualizing-high-dimensional-vectors-with-t-sne-or-pca-d616e222247a

deephub翻译组

标签:

“使用Tensorboard投影进行高维向量的可视化”的评论:

还没有评论