# 数据集导入

# 前提条件

数据集商品已传输至本地目录。

# 操作步骤

Octopus支持您将在生态市场购买的数据集商品导入到您的OBS桶中,并通过OBS桶上传自定义格式的数据集,用于训练服务。导入数据集的操作步骤如下:

  1. 单击“数据服务”>“数据集”>“导入数据集”。

    查看“数据及导入服务隐私协议”,确认无误后,勾选“同意”并确认。

  2. 将数据集上传到OBS桶,并填写访问密钥。

    表 1 填写账号访问秘钥和OBS地址

    参数

    说明

    访问密钥

    包含访问密钥ID(AK)和私有访问密钥(SK)两部分,导入数据集时,通过AK识别访问用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。

    密钥获取方式请参见“如何获取访问密钥AK/SK?”。

    OBS地址

    数据集在OBS桶中的存储路径。在将数据集导入Octopus平台前,需要先上传到OBS桶中。

    数据集上传OBS桶的方法请参见“如何上传文件到OBS桶?”。

    region

    数据集导入到Octopus平台哪个区域,默认同账号登录和访问的区域一致。

  3. 填写数据集基本信息

    自定义填写数据集名称、描述信息,选取标注类型,数据集默认版本01。

  4. 选取数据集格式和类型

    数据集类型支持图片,格式支持用户自定义,在“数据集格式”下拉框单击“新增数据集格式”为格式命名。

    • Pascal_VOC:若您上传的是Pascal_VOC格式数据集,则可以使用内置算法进行训练,同时数据集需要符合一定的格式规范”;

      注意: 如果是用Pascal_VOCl VOC格式,请使用别的名称,例如“VOC”。

    • 自定义数据集格式:若您上传的是其他格式数据集,则需要在“训练服务”中上传和数据集格式匹配的算法,以便进行后续的训练。

  5. 通过开关选择是否“难例数据”,打开开关将同步创建难例数据集。

    上述信息均填写完成后,单击“导入”完成数据集上传。

上次更新: 5/6/2021, 7:57:44 PM