# 数据集

数据集模块将采集到的数据和训练开发过程中收集的数据等进行集合,支持数据集多版本管理和统计。同时支持您将本地符合平台规范的数据集导入到Octopus平台,以及将平台上的数据集导出到自有OBS桶中。便于用户在开发过程中,不断对模型进行优化更新。

表 1 数据集主要属性说明

参数

说明

版本

  • 支持多版本管理,新建默认版本为v1;
  • 支持手动增量添加数据集版本。

数据集用途

Pascal_VOC标注格式的数据集用于训练服务,OCTOPUS标注格式的数据集用于标注平台从OBS导入创建标注任务;

版本更新方式

当前支持手动更新数据集。

标注格式

支持Pasca_VOC和OCTOPUS标注格式,同时支持用户导入自定义格式数据集。

数据集类型

当前有图片和点云两种类型。

难例数据集

开关打开后,该数据集将作为难例数据集应用于训练。

脱敏

开关打开后,将对车牌、人脸等敏感信息做马赛克处理。

数据源时间

  • 支持筛选数据源入库的开始时间和结束时间;
  • 支持筛选数据源标注的开始时间和结束时间。

数据源标签

  • 支持筛选标注任务;
  • 支持筛选指定标注label;
  • 支持筛选指定标签tag。

# 数据集高级查找

Octopus数据集模块支持高级查找功能,快速查找所需数据集,支持通过以下维度查找:

  • 创建时间、修改时间;
  • 数据类型、版本更新方式;
  • 标签label、标签tag。

数据集详情如下:

说明:

  • 自定义格式数据集暂不支持数据样例查看;
  • 点云数据集因在线渲染点云图像,故会出现短暂“加载中”过程,请您耐心等待。
上次更新: 6/29/2021, 2:13:44 PM