# 导入数据集

Octopus平台支持您从华为云OBS(对象存储服务),导入自定义格式的数据集,并将数据集用于训练。

# 操作步骤

  1. 单击“数据服务>数据集>新建数据集>OBS导入”;

    查看“数据集导入服务隐私协议”,确认无误后,勾选“同意”并确认。

  2. 将数据集导入至Octopus,并填写访问密钥;

    表 1 填写账号访问秘钥和OBS地址

    参数

    说明

    云服务提供商

    当前支持华为云。

    访问密钥

    包含访问密钥ID(AK)和私有访问密钥(SK)两部分,导入数据集时,通过AK识别访问用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。

    密钥获取方式请参见“如何获取访问密钥AK/SK?”。

    OBS地址

    数据集在OBS桶中的存储路径。在将数据集导入Octopus平台前,需要先上传到OBS桶中。

    数据集上传OBS桶的方法请参见“如何上传文件到OBS桶?”。

    region

    数据集导入到Octopus平台哪个区域,默认同账号登录和访问的区域一致。

  3. 填写数据集基本信息;

    自定义填写数据集名称、描述信息,选取标注类型,数据集默认版本1.0。

    • 数据集名称:包含中英文、数字、“_”“-”,不得超过64个字符;
    • 数据集描述:简要描述数据集,不包含“@#$%^&*<>/”,不得超过255个字符;
    • 标注:数据集包含的标注;
    • 创建版本:新建数据集默认版本为1.0。
  4. 选取数据集格式和类型;

    数据集类型支持图片和3D点云,标注格式支持用户自定义。

    • Pascal_VOC:若您上传的是Pascal_VOC格式数据集,则可以使用内置算法进行训练,同时数据集需要符合一定的格式规范,详情请参见“Pascal_VOC数据集格式说明”;

      注意: 如果是用户自定义的Pascal_VOC格式,请使用别的名称,例如“VOC”。

    • 自定义数据集格式:若您上传的是其他格式数据集,则需要在训练服务中,上传和数据集格式匹配的算法,以便进行后续训练,上传方式请参见“自定义算法”。

  5. 通过开关选择是否“难例数据”,打开开关将同步创建难例数据集。

    上述信息均填写完成后,单击“创建”完成数据集上传。

上次更新: 2020/12/25 16:26:48