# 数据集导入
# 前提条件
数据集商品已传输至本地目录。
# 操作步骤
Octopus支持您将在生态市场购买的数据集商品导入到您的OBS桶中,并通过OBS桶上传自定义格式的数据集,用于训练服务。导入数据集的操作步骤如下:
单击“数据服务”>“数据集”>“导入数据集”。
查看“数据及导入服务隐私协议”,确认无误后,勾选“同意”并确认。
将数据集上传到OBS桶,并填写访问密钥。
表 1 填写账号访问秘钥和OBS地址
包含访问密钥ID(AK)和私有访问密钥(SK)两部分,导入数据集时,通过AK识别访问用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。
密钥获取方式请参见“如何获取访问密钥AK/SK?”。
数据集在OBS桶中的存储路径。在将数据集导入Octopus平台前,需要先上传到OBS桶中。
数据集上传OBS桶的方法请参见“如何上传文件到OBS桶?”。
填写数据集基本信息
自定义填写数据集名称、描述信息,选取标注类型,数据集默认版本01。
选取数据集格式和类型
数据集类型支持图片,格式支持用户自定义,在“数据集格式”下拉框单击“新增数据集格式”为格式命名。
Pascal_VOC:若您上传的是Pascal_VOC格式数据集,则可以使用内置算法进行训练,同时数据集需要符合一定的格式规范”;
注意: 如果是用Pascal_VOCl VOC格式,请使用别的名称,例如“VOC”。
自定义数据集格式:若您上传的是其他格式数据集,则需要在“训练服务”中上传和数据集格式匹配的算法,以便进行后续的训练。
通过开关选择是否“难例数据”,打开开关将同步创建难例数据集。
上述信息均填写完成后,单击“导入”完成数据集上传。