学習を実行するコマンド「mlagents-learn」について見ていく。
「Unity ML-Agents」では、「mlagents-learn」を使って、エージェントの学習を行います。「mlagents-learn」は、「」と「」のパラメータで、学習方法を設定します。
mlagents-learn <学習設定ファイルのパス> --env=<Unityアプリのパス> --run-id=<実行ID>
## mlagents-learnのコマンドライン引数
基本のコマンドライン引数は、次のとおりです。
コマンドライン引数 | 説明 |
---|---|
-h,–help | ヘルプの表示 |
–env=<ENV-PATH> |
Unityアプリのパス(デフォルト:Unityエディタ) |
–run-id=<RUN_ID> |
学習結果を識別するための実行ID(デフォルト:ppo) ※デフォルト名はppoだが、強化学習アルゴリズムとは関係なく、フォルダ名の設定になる |
–num-envs=<NUM_ENVS> |
Unityインスタンスの起動数(デフォルト:1) |
–results-dir=<RESULTS_DIR> |
出力フォルダ(デフォルト:results) |
–seed=<SEED> |
乱数シード(デフォルト:-1) |
–base-port=<BASE_PORT> |
ベースポート(デフォルト:5005) |
–debug | デバッグ出力 |
–env-args=<ARGS> |
環境引数(デフォルト:None) |
既存モデルが存在する時のコマンドライン引数は、次のとおりです。
コマンドライン引数 | 説明 |
---|---|
–resume | 既存モデルの学習再開 |
–inference | 既存モデルの推論実行 |
–force | 既存モデルを上書きして、新規に学習開始 |
–initialize-form=<RUN_ID> |
既存モデルを初期値にして、新規に学習開始 |
画面表示関連のコマンドライン引数は、次のとおりです。
コマンドライン引数 | 説明 |
---|---|
–width = <WIDTH> |
画面幅(デフォルト:84) |
–height = <HEIGHT> |
画面高さ(デフォルト:84) |
–quality-level=<QUALITY_LEVEL> |
品質レベル(デフォルト:5、低0~5高) |
–time-scale=<TIME_SCALE> |
タイムスケール(デフォルト:20) |
–target-frame-rate=<TARGET_FRAME_RATE> |
ターゲットフレームレート(デフォルト:60) |
–no-graphics | 画面表示なし |
PyTorch関連のコマンドライン
コマンドライン引数 | 説明 |
---|---|
–torch-device=<DEVICE> |
torch.deviceの設定(”cpu”、”cuda”、”cuda:0”など) |