Unity_Lesson

time_horizon は、Unity ML-Agentsのトレーニングプロセスにおいて、エージェントがどのくらいの期間、報酬を「記憶」するかを決定する重要なパラメータです。具体的には、エージェントが1つのエピソード内で得られた報酬をどの程度、過去の行動と関連づけるかを制御します。

time_horizon の概要

具体的な動作

例:

時間長さと効率

設定のポイント

結論

time_horizon はエージェントが過去の行動と報酬を関連づける期間を示し、タスクに応じた適切な設定が学習効率を高めます。