# 新建数据集
# 创建数据集
对数据进行处理和标注后,您需要创建一个数据集进行自动驾驶模型训练,本节介绍如何在Octopus上创建数据集。
# 前提条件
请确保已完成数据标注。
# 操作步骤
登录Octopus管理控制台,在左侧菜单栏中单击“数据服务>数据集>新建数据集”。
单击“创建数据集”,填写数据集信息。
填写数据集基本信息
- 数据集名称:自定义数据集名称,不得超过64个字符。支持中英文、数字、“-”、“_”,不支持特殊字符;
- 数据集描述:数据集内容、用途等的简要描述,不包含“@#$%^&*<>\”,不得超过255个字符;
- 创建版本:数据集版本号,新建默认版本为v1。
选择标注格式
当前标注格式有Pascal_VOC和OCTOPUS两种格式,其中OCTOPUS格式用于标注平台从OBS创建重标任务,请勿用于训练。
设置已标注数据过滤选择项
参考下表填写,含“*”为必填项。
表 1 已标注数据过滤选择项说明(含*为必填项)
创建完数据集后,系统自动跳至数据集列表页面,您可以在该页面对数据集进行查看、删除、更新版本操作。
# 本地直传数据集
Octopus平台支持您从本地上传OCTOPUS、Pascal_VOC和自定义标注格式的数据集,其中OCTOPUS标注格式的数据集用于创建标注任务,Pascal_VOC和自定义标注格式的数据集,用于创建训练任务。
# 操作步骤
单击“数据服务>数据集>新建数据集>本地直传”。
填写数据集信息
表 2 数据集信息说明(带*为必填)
当前Octopus预置标注格式有Pascal_VOC和OCTOPUS两种格式,其中OCTOPUS格式用于标注平台从OBS创建重标任务,请勿用于训练。
自定义标注格式名称不得超过64个字符。支持中英文、数字、“-”、“_”,不支持特殊字符。
- Pascal_VOC:若您上传的是Pascal_VOC格式数据集,则可以使用内置算法进行训练,同时数据集需要符合一定的格式规范,详情请参见“Pascal_VOC数据集格式说明”;
- 自定义数据集格式:若您上传的是其他格式数据集,则需要在训练服务中,上传和数据集格式匹配的算法,以便进行后续训练,上传方式请参见“自定义算法”。
- OCTOPUS:创建OCTOPUS标注格式的数据集,用于标注平台从OBS导入创建标注任务,创建的OCTOPUS数据集需要符合OCTOPUS格式的规范,详情请参见OCTOPUS数据集格式说明。
上传文件
本地选择数据源文件。
← 语义分割点云标注任务 导出数据集 →