标注工具
最近在学习使用标注工具,图像领域比较知名的标注工具如labelme,最近又发现了一款十分好用的集成标注工具label-studio,功能十分强大。故做下记录,以便于需要时使用。
实验环境:
Ubuntu 20.04, 下面的配置都是基于anaconda进行的。
一、Labelme
安装
安装非常简单,
# conda create --name labelme python=3.8# conda activate labelme# pip install pyqt5# pip install labelme
使用
进入labelme环境以后,运行# labelme 命令,可以看到打开的labelme界面,如下,比较简陋,
如上图所示,加载一张图片以后可以通过Create Polygons来标注目标的边界框,然后通过Edit Polygons进行微调, 标注完成后可以在右边看到label_list, polygon list,.
导出
点击左侧的save,标注信息保存为json文件,打开后如下:
可以看到标注信息实际上就是边界框(4个points)和label。
二、label-studio
简介
Label-studio是一款功能十分强大的标注工具IDE, 具有如下特点:
可配置: 使用jsx tags配置,自定义配置标注页面,所以可标注格式很多,样式也可以自定义
协作标注: 由两个或更多人label同一任务,然后比较结果,还支持用户名密码简单的认证。 支持按预测的模型预测的probability的大小顺序标注,默认按导入数据的索引顺序标注。
多种数据类型: 您定义自己的具有不同的label类型, Images, Audios, Texts, HTMLs,已有大量模板,直接使用接口
支持导入格式: JSON, CSV, TSV, RAR and ZIP archives,支持API导入数据。
NPM嵌入: 前端是NPM包, NPM package. 您可以将其包含在您的项目中 .机器学习: 机器学习的集成支持。 可视化并比较来自不同模型的预测。
pre-labeling功能很好,可以实现用训练的模型预标注数据,那么结果人工标注前就比较方便,而且还知道模型预测的怎么样支持docker容器部署方便的API接口
安装
# conda create --name label-studio python=3.8# conda activate label-studio# pip install label-studio
注:因为网络原因我湿了好多次才安装成功。
使用
label-studio环境下,执行 # label-studio即可打开界面,如下图所示,
点击右边的“Create” 来创建Projects,Project的创建分为3步:
(1) 设置项目名称和描述信息
(2)导入数据,可以通过URL导入或者本地文件夹,支持 文本,视频,音频数据,各种格式都支持哈。
(3)指定具体的标注任务,指定以后进一步设置相关所需的信息
例子
我创建了一个NLP -text classification的Project, 在labeling setup这一步我设置了共三个类别:Command, Non-Command, Neutral。创建完成以后如下图所示:
由于我导入的是一个文本数据,每一行对应一个样本,也就是上图中的一个个task, 接下来要对每个task设置标记。
随便选择一个task右击打开如下图,直接从上一步设置label space中选中一个标记即可,记得点击Submit进行提交, 提交之后可以看到左边的对应Task的Total anacontation per task状态由0变为1。
当然也可以点击上边的label all tasks, 然后连续地进行宁标注任务。
所有tasks标注完成以后, 就可以导出了,直接点击右上角的Export导出为指定格式的文件即可。
当然也可以使用模型进行辅助标记, 这个对于图像标注任务非常有帮助,能够大幅提升标注的效率, 后边有时间再细说。
总结
Label-studio功能非强大,并且本身也在不断升级,推荐使用。
版权归原作者 MasterQKK 被注册 所有, 如有侵权,请联系我们删除。