# 导入数据集
Octopus平台支持您从华为云OBS(对象存储服务),导入自定义格式的数据集,并将数据集用于训练。
# 操作步骤
单击“数据服务>数据集>新建数据集>OBS导入”;
查看“数据集导入服务隐私协议”,确认无误后,勾选“同意”并确认。
将数据集导入至Octopus,并填写访问密钥;
表 1 填写账号访问秘钥和OBS地址
包含访问密钥ID(AK)和私有访问密钥(SK)两部分,导入数据集时,通过AK识别访问用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。
密钥获取方式请参见“如何获取访问密钥AK/SK?”。
数据集在OBS桶中的存储路径。在将数据集导入Octopus平台前,需要先上传到OBS桶中。
数据集上传OBS桶的方法请参见“如何上传文件到OBS桶?”。
填写数据集基本信息;
自定义填写数据集名称、描述信息,选取标注类型,数据集默认版本1.0。
- 数据集名称:包含中英文、数字、“_”“-”,不得超过64个字符;
- 数据集描述:简要描述数据集,不包含“@#$%^&*<>/”,不得超过255个字符;
- 标注:数据集包含的标注;
- 创建版本:新建数据集默认版本为1.0。
选取数据集格式和类型;
数据集类型支持图片和3D点云,标注格式支持用户自定义。
Pascal_VOC:若您上传的是Pascal_VOC格式数据集,则可以使用内置算法进行训练,同时数据集需要符合一定的格式规范,详情请参见“Pascal_VOC数据集格式说明”;
注意: 如果是用户自定义的Pascal_VOC格式,请使用别的名称,例如“VOC”。
自定义数据集格式:若您上传的是其他格式数据集,则需要在训练服务中,上传和数据集格式匹配的算法,以便进行后续训练,上传方式请参见“自定义算法”。
通过开关选择是否“难例数据”,打开开关将同步创建难例数据集。
上述信息均填写完成后,单击“创建”完成数据集上传。