Unity_Lesson

3-6 mlagents-learn

学習を実行するコマンド「mlagents-learn」について見ていく。

mlagents-learnでの学習の実行

「Unity ML-Agents」では、「mlagents-learn」を使って、エージェントの学習を行います。「mlagents-learn」は、「」と「」のパラメータで、学習方法を設定します。

mlagents-learn <学習設定ファイルのパス> --env=<Unityアプリのパス> --run-id=<実行ID>


## mlagents-learnのコマンドライン引数

基本のコマンドライン引数は、次のとおりです。

コマンドライン引数 説明
-h,–help ヘルプの表示
–env=<ENV-PATH> Unityアプリのパス(デフォルト:Unityエディタ)
–run-id=<RUN_ID> 学習結果を識別するための実行ID(デフォルト:ppo)
※デフォルト名はppoだが、強化学習アルゴリズムとは関係なく、フォルダ名の設定になる
–num-envs=<NUM_ENVS> Unityインスタンスの起動数(デフォルト:1)
–results-dir=<RESULTS_DIR> 出力フォルダ(デフォルト:results)
–seed=<SEED> 乱数シード(デフォルト:-1)
–base-port=<BASE_PORT> ベースポート(デフォルト:5005)
–debug デバッグ出力
–env-args=<ARGS> 環境引数(デフォルト:None)


既存モデルが存在する時のコマンドライン引数は、次のとおりです。

コマンドライン引数 説明
–resume 既存モデルの学習再開
–inference 既存モデルの推論実行
–force 既存モデルを上書きして、新規に学習開始
–initialize-form=<RUN_ID> 既存モデルを初期値にして、新規に学習開始


画面表示関連のコマンドライン引数は、次のとおりです。

コマンドライン引数 説明
–width = <WIDTH> 画面幅(デフォルト:84)
–height = <HEIGHT> 画面高さ(デフォルト:84)
–quality-level=<QUALITY_LEVEL> 品質レベル(デフォルト:5、低0~5高)
–time-scale=<TIME_SCALE> タイムスケール(デフォルト:20)
–target-frame-rate=<TARGET_FRAME_RATE> ターゲットフレームレート(デフォルト:60)
–no-graphics 画面表示なし


PyTorch関連のコマンドライン

コマンドライン引数 説明
–torch-device=<DEVICE> torch.deviceの設定(”cpu”、”cuda”、”cuda:0”など)