# 训练任务

Octopus平台为您提供训练任务的管理,支持您查询、删除训练任务,查看训练任务日志,创建训练任务并通过训练任务生成训练模型。

# 创建训练任务

  1. 单击“训练服务>训练任务>创建训练任务”。

  2. 在基本信息部分,填写训练任务名称,添加对训练任务的描述。

    • 任务名称:包含中英文、数字、“_”“-”,不得超过64个字符;
    • 任务描述:简要描述任务,不包含“@#$%^&*<>/”,不得超过255个字符。
  3. 在选择数据集部分,您可选择“数据服务>数据集”中现有数据集或用户自有OBS桶中符合规范的数据集,支持添加多个数据集,支持添加同一个数据集的不同版本。

    说明:

  4. 在选择训练算法部分,根据需要选择自定义算法或系统内置算法。

    1. 从下拉框中选择算法文件,设置算法参数;

      说明:

      • 字符:支持输入英文、下划线、数字;
      • 范围:参数取值范围请参考系统内置算法中各内置算法的参数取值范围。
    2. 若选择自定义算法,需提前上传算法文件至“算法管理”模块,算法文件包请参考算法文件说明

  5. 配置环境变量,通过注入环境变量至容器中,用户可以快速获取业务相关常量。;

    说明: 字符:支持输入英文、下划线、数字以及".";

  6. 从下拉框中选择训练模型,训练模型需提前在“训练服务>训练模型”中创建成功。

    说明:

    • 训练模型的标注必须是训练任务选择的数据集标注的子集;
    • 训练模型使用的AI引擎与训练任务选择的算法的AI引擎一致。
  7. 单击“创建”,新建训练任务状态为“提交中”。

  8. 单击“任务名称”,可在任务详情页查看该任务的具体信息以及设置的参数信息。

# 训练任务日志查看下载

训练任务运行的过程中生成日志,训练任务模块提供了日志的查看以及下载功能,支持您查看训练任务的运行情况。训练任务生成的日志文件以“stdout.log”(标准输出日志)为后缀。

单击训练任务名称,在该训练任务的详情页面,单击“任务日志”,可查看该训练任务日志及日志详情。支持下载至本地。若日志较多,您可以在搜索框中输入关键字,查找指定日志内容。搜索内容以1MB为单位,并非全部内容。

如图,在日志服务页面中的日志列表部分详细展示了该训练任务包含的日志文件的大小以及最近写入时间。单击文件后的“查看”,该文件的详细执行过程则在日志详情部分展示。您也可以在日志文件后的“操作”一栏中,单击“下载”,即可将该日志文件下载到本地查看。

# 删除训练任务

不再满足业务所需的训练任务,您可以将其删除。勾选任务名称前的勾选框,可批量删除任务。

说明:

  • 任务状态为“删除中”、“停止中”,不可删除。
  • 删除后不可恢复,请谨慎操作。

# 重启训练任务

当训练任务处于“提交失败、运行异常、已停止、已完成、重启失败”状态时,您可以单击训练任务后“操作”一栏内的“重启”,可重新选择训练数据集和训练模型并重启该训练任务。

# 停止训练任务

对于运行中、提交中、资源配额检查中的任务,您可以单击该条任务后的“停止”对该条训练任务进行停止。

# 查询训练任务

您可以根据训练任务所处的作业状态进行过滤,在搜索框内输入训练任务的名称,单击,进行查询。

表 1 作业状态与操作的约束关系

作业状态

重启

删除

停止

未知

提交中

提交失败

运行中

运行异常

已完成

停止中

停止失败

已停止

删除中

删除失败

不存在

重启失败

资源配额检查中

资源配额检查失败

上次更新: 2020/12/25 16:26:48