AMZ2004
/

poca-SoccerTwos_Edited

Reinforcement Learning

deep-reinforcement-learning

ML-Agents-SoccerTwos

Model card Files Files and versions

AMZ2004 commited on 17 days ago

Commit

e7c2b1d

·

verified ·

1 Parent(s): 2def259

Edited model for certification

Files changed (1) hide show

configuration.yaml +32 -0

configuration.yaml ADDED Viewed

	@@ -0,0 +1,32 @@

+behaviors:
+  SoccerTwos:
+    trainer_type: poca
+    hyperparameters:
+      batch_size: 4096  # تغییر از 2048 به 4096
+      buffer_size: 20480
+      learning_rate: 0.0005  # تغییر از 0.0003 به 0.0005
+      beta: 0.005
+      epsilon: 0.2
+      lambd: 0.95
+      num_epoch: 3
+      learning_rate_schedule: constant
+    network_settings:
+      normalize: false
+      hidden_units: 512
+      num_layers: 2
+      vis_encode_type: simple
+    reward_signals:
+      extrinsic:
+        gamma: 0.99
+        strength: 1.0
+    keep_checkpoints: 5
+    max_steps: 5000000
+    time_horizon: 1000
+    summary_freq: 10000
+    self_play:
+      save_steps: 50000
+      team_change: 200000
+      swap_steps: 2000
+      window: 10
+      play_against_latest_model_ratio: 0.5
+      initial_elo: 1200.0