hishamcse
/

rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning

sample-factory

TensorBoard

deep-reinforcement-learning

Eval Results

Model card Files Files and versions Metrics Training metrics Community

hishamcse commited on Jun 30, 2024

Commit

9222647

verified ·

1 Parent(s): 70583fb

Upload config.json with huggingface_hub

Browse files

Files changed (1) hide show

config.json +32 -16

config.json CHANGED Viewed

@@ -4,7 +4,7 @@
   "env": "doom_health_gathering_supreme",
   "experiment": "default_experiment",
   "train_dir": "/kaggle/working/train_dir",
-  "restart_behavior": "resume",
   "device": "gpu",
   "seed": null,
   "num_policies": 1,
@@ -15,9 +15,9 @@
   "worker_num_splits": 2,
   "policy_workers_per_policy": 1,
   "max_policy_lag": 1000,
-  "num_workers": 8,
-  "num_envs_per_worker": 4,
-  "batch_size": 1024,
   "num_batches_per_epoch": 1,
   "num_epochs": 1,
   "rollout": 32,
@@ -42,7 +42,7 @@
   "adam_eps": 1e-06,
   "adam_beta1": 0.9,
   "adam_beta2": 0.999,
-  "max_grad_norm": 4.0,
   "learning_rate": 0.0001,
   "lr_schedule": "constant",
   "lr_schedule_kl_threshold": 0.008,
@@ -50,7 +50,7 @@
   "obs_scale": 255.0,
   "normalize_input": true,
   "normalize_input_keys": null,
-  "decorrelate_experience_max_seconds": 0,
   "decorrelate_envs_on_one_worker": true,
   "actor_worker_gpus": [],
   "set_workers_cpu_affinity": true,
@@ -61,10 +61,10 @@
   "flush_summaries_interval": 30,
   "stats_avg": 100,
   "summaries_use_frameskip": true,
-  "heartbeat_interval": 20,
-  "heartbeat_reporting_interval": 600,
-  "train_for_env_steps": 10000000,
-  "train_for_seconds": 10000000000,
   "save_every_sec": 120,
   "keep_checkpoints": 2,
   "load_checkpoint_kind": "latest",
@@ -83,10 +83,10 @@
   ],
   "use_rnn": true,
   "rnn_size": 512,
-  "rnn_type": "gru",
   "rnn_num_layers": 1,
   "decoder_mlp_layers": [],
-  "nonlinearity": "elu",
   "policy_initialization": "orthogonal",
   "policy_init_gain": 1.0,
   "actor_critic_share_weights": true,
@@ -128,12 +128,28 @@
   "wide_aspect_ratio": false,
   "eval_env_frameskip": 1,
   "fps": 35,
-  "command_line": "--env=doom_health_gathering_supreme --num_workers=8 --num_envs_per_worker=4 --train_for_env_steps=10000000",
   "cli_args": {
     "env": "doom_health_gathering_supreme",
-    "num_workers": 8,
-    "num_envs_per_worker": 4,
-    "train_for_env_steps": 10000000
   },
   "git_hash": "unknown",
   "git_repo_name": "not a git repository",

   "env": "doom_health_gathering_supreme",
   "experiment": "default_experiment",
   "train_dir": "/kaggle/working/train_dir",
+  "restart_behavior": "restart",
   "device": "gpu",
   "seed": null,
   "num_policies": 1,
   "worker_num_splits": 2,
   "policy_workers_per_policy": 1,
   "max_policy_lag": 1000,
+  "num_workers": 20,
+  "num_envs_per_worker": 12,
+  "batch_size": 2048,
   "num_batches_per_epoch": 1,
   "num_epochs": 1,
   "rollout": 32,
   "adam_eps": 1e-06,
   "adam_beta1": 0.9,
   "adam_beta2": 0.999,
+  "max_grad_norm": 0.0,
   "learning_rate": 0.0001,
   "lr_schedule": "constant",
   "lr_schedule_kl_threshold": 0.008,
   "obs_scale": 255.0,
   "normalize_input": true,
   "normalize_input_keys": null,
+  "decorrelate_experience_max_seconds": 1,
   "decorrelate_envs_on_one_worker": true,
   "actor_worker_gpus": [],
   "set_workers_cpu_affinity": true,
   "flush_summaries_interval": 30,
   "stats_avg": 100,
   "summaries_use_frameskip": true,
+  "heartbeat_interval": 10,
+  "heartbeat_reporting_interval": 300,
+  "train_for_env_steps": 1000000000,
+  "train_for_seconds": 360000,
   "save_every_sec": 120,
   "keep_checkpoints": 2,
   "load_checkpoint_kind": "latest",
   ],
   "use_rnn": true,
   "rnn_size": 512,
+  "rnn_type": "lstm",
   "rnn_num_layers": 1,
   "decoder_mlp_layers": [],
+  "nonlinearity": "relu",
   "policy_initialization": "orthogonal",
   "policy_init_gain": 1.0,
   "actor_critic_share_weights": true,
   "wide_aspect_ratio": false,
   "eval_env_frameskip": 1,
   "fps": 35,
+  "command_line": "--env=doom_health_gathering_supreme --restart_behavior=restart --num_workers=20 --num_envs_per_worker=12 --batch_size=2048 --recurrence=32 --exploration_loss_coeff=0.001 --exploration_loss=symmetric_kl --ppo_clip_value=0.2 --max_grad_norm=0.0 --obs_scale=255.0 --decorrelate_experience_max_seconds=1 --heartbeat_interval=10 --heartbeat_reporting_interval=300 --train_for_env_steps=1000000000 --train_for_seconds=360000 --benchmark=false --use_rnn=true --rnn_type=lstm --nonlinearity=relu",
   "cli_args": {
     "env": "doom_health_gathering_supreme",
+    "restart_behavior": "restart",
+    "num_workers": 20,
+    "num_envs_per_worker": 12,
+    "batch_size": 2048,
+    "recurrence": 32,
+    "exploration_loss_coeff": 0.001,
+    "exploration_loss": "symmetric_kl",
+    "ppo_clip_value": 0.2,
+    "max_grad_norm": 0.0,
+    "obs_scale": 255.0,
+    "decorrelate_experience_max_seconds": 1,
+    "heartbeat_interval": 10,
+    "heartbeat_reporting_interval": 300,
+    "train_for_env_steps": 1000000000,
+    "train_for_seconds": 360000,
+    "benchmark": false,
+    "use_rnn": true,
+    "rnn_type": "lstm",
+    "nonlinearity": "relu"
   },
   "git_hash": "unknown",
   "git_repo_name": "not a git repository",