当前位置：首页 > news >正文

从零到一：使用Labelme高效构建图像分割数据集

news 2026/7/5 12:20:24

1. 为什么选择Labelme进行图像分割标注

第一次接触图像分割任务时，我被各种标注工具搞得眼花缭乱。试过几款商业软件后，偶然发现了Labelme这个开源神器，从此再也没换过工具。Labelme最吸引我的是它的轻量化和灵活性——不需要复杂的配置，一个pip命令就能安装，却能完成从简单矩形标注到复杂多边形分割的全套工作。

作为MIT CSAIL实验室出品的工具，Labelme在学术圈积累了良好的口碑。它的核心优势在于对分割任务的专业支持。不同于常规标注工具只能画矩形框，Labelme允许你用多边形精确勾勒物体轮廓。我在做自动驾驶场景理解项目时，需要标注各种不规则形状的交通标志，正是这个功能拯救了我。

安装过程简单到令人发指。只需要Python环境（建议3.6+版本），一行命令就能搞定：

pip install labelme

如果想更干净的环境管理，可以先用conda创建虚拟环境：

conda create -n labelme python=3.8 conda activate labelme

启动界面后你会看到清爽的UI布局：左侧是工具栏，中间是图像显示区，右侧是标签列表。这种设计让标注过程非常直观，新手也能快速上手。我特别喜欢它的颜色编码系统——不同类别的标注会自动分配对比色，在复杂场景中也能清晰区分。

2. 从零开始建立标注规范

很多新手会直接打开图片就开始标注，这是个大误区。在医疗影像分析项目中，我们团队曾经因为前期没统一标准，导致后期不得不返工上千张标注。这里分享我的标准工作流程：

首先建立规范的目录结构。建议采用如下组织形式：

project_root/ ├── images/ # 原始图像 ├── annotations/ # 标注json文件 └── labels.txt # 类别定义文件

重点在于labels.txt的编写。虽然Labelme支持临时添加标签，但预先定义好类别会让工作更高效。文件格式如下：

__ignore__ _background_ road car pedestrian traffic_light

前两行是固定格式，从第三行开始写入你的实际类别。每个类别占一行，不要用中文或特殊字符。我在智慧城市项目中测试过，这种规范的标签文件能使标注效率提升40%以上。

启动Labelme时通过命令行加载标签文件：

labelme --labels labels.txt

这样右侧标签列表会预加载你的类别，标注时直接选择即可，避免手动输入导致的拼写不一致。

3. 高效标注的核心技巧

掌握了基本操作后，这些实战技巧能让你事半功倍：

多边形标注的黄金法则：用尽量少的点勾勒轮廓。按住Shift键点击可以添加点，右键点击点可以删除。对于曲线区域，我习惯先用5-6个点确定大体形状，再用EditPolygons工具微调。标注建筑物这类规则物体时，配合键盘方向键可以精确控制点位置。

批量处理的秘密：设置好输出目录后（File > Change Output Dir），使用"Open Dir"批量导入图片。标注完一张后按Ctrl+N快速跳转下一张，系统会自动保存当前标注。我测试过，这种流水线操作比单张处理快3倍。

高级功能活用：

按空格键隐藏/显示标注，方便检查原始图像
Ctrl+Z撤销错误操作，最多支持20步回退
使用"EditPolygons"模式拖动整个多边形调整位置
对相似物体使用Copy/Paste功能（Ctrl+C/Ctrl+V）

在医学影像标注中，我发现个小技巧：先画个粗略多边形，然后用"Add Point to Edge"在关键部位添加控制点。这样既能保证精度，又节省了时间。

4. 标注结果的质量控制

标注质量直接影响模型效果，这几个检查方法值得收藏：

视觉验证：在保存前务必旋转查看各个角度。特别是重叠区域，要确保边界清晰。我习惯开启"Save With Image Data"选项临时保存带图像的json，方便复查。

数据一致性检查：用这个Python脚本快速统计标注情况：

import json import os ann_dir = "annotations" class_counts = {} for file in os.listdir(ann_dir): with open(os.path.join(ann_dir, file)) as f: data = json.load(f) for shape in data["shapes"]: class_counts[shape["label"]] = class_counts.get(shape["label"], 0) + 1 print(class_counts)

边界问题处理：遇到物体被图像边缘截断的情况，建议标注到图像边界即可，不要强行补全。在自动驾驶数据集中，这种处理方式能让模型更好地学习真实场景。

5. 转换为训练可用格式

Labelme生成的json需要转换成模型能读取的格式。最常见的是转VOC和COCO格式：

VOC格式转换：

git clone https://github.com/wkentaro/labelme cd labelme/examples/semantic_segmentation python labelme2voc.py annotations data_voc --labels labels.txt

这会生成包含JPEGImages和SegmentationClassPNG的目录结构。SegmentationClassPNG下的灰度图中，像素值对应类别ID，非常适合PyTorch框架。

COCO格式转换：

python labelme2coco.py annotations dataset_coco --labels labels.txt

生成的annotations.json包含完整的COCO格式标注。如果遇到pycocotools安装问题，Windows用户可以用：

pip install pycocotools-windows

对于自定义需求，可以直接解析json文件。这个代码片段展示了如何提取多边形坐标：

import json with open("example.json") as f: data = json.load(f) for shape in data["shapes"]: print(f"Label: {shape['label']}") print(f"Points: {shape['points']}") print(f"Shape type: {shape['shape_type']}")