Spaces:

Tarive
/

HRM-anchoring-bias-model

Running

Tarive commited on Aug 5

Commit

db72e03

verified ·

1 Parent(s): b829e8f

Upload 3 files

Files changed (3) hide show

activity_code_map.json ADDED Viewed

+{
+  "D43": 1,
+  "DP1": 2,
+  "DP2": 3,
+  "DP5": 4,
+  "F30": 5,
+  "F31": 6,
+  "F32": 7,
+  "F99": 8,
+  "G11": 9,
+  "I01": 10,
+  "IK1": 11,
+  "IK2": 12,
+  "K00": 13,
+  "K01": 14,
+  "K08": 15,
+  "K23": 16,
+  "K24": 17,
+  "K99": 18,
+  "N01": 19,
+  "P01": 20,
+  "P20": 21,
+  "P30": 22,
+  "P42": 23,
+  "P50": 24,
+  "R00": 25,
+  "R01": 26,
+  "R03": 27,
+  "R13": 28,
+  "R15": 29,
+  "R16": 30,
+  "R18": 31,
+  "R21": 32,
+  "R25": 33,
+  "R33": 34,
+  "R34": 35,
+  "R35": 36,
+  "R36": 37,
+  "R37": 38,
+  "R41": 39,
+  "R43": 40,
+  "R44": 41,
+  "R56": 42,
+  "R61": 43,
+  "RF1": 44,
+  "S10": 45,
+  "SC2": 46,
+  "T32": 47,
+  "T34": 48,
+  "U01": 49,
+  "U18": 50,
+  "U19": 51,
+  "U24": 52,
+  "U2F": 53,
+  "U54": 54,
+  "UG1": 55,
+  "UH3": 56,
+  "UM1": 57,
+  "UM2": 58,
+  "ZIA": 59,
+  "ZIC": 60,
+  "ZID": 61
+}

config.yaml ADDED Viewed

+arch:
+  H_cycles: 2
+  H_layers: 4
+  L_cycles: 2
+  L_layers: 4
+  expansion: 4
+  halt_exploration_prob: 0.1
+  halt_max_steps: 16
+  hidden_size: 512
+  loss:
+    loss_type: stablemax_cross_entropy
+    name: losses@ACTLossHead
+  name: hrm.hrm_act_v1@HierarchicalReasoningModel_ACTV1
+  num_heads: 8
+  pos_encodings: rope
+  puzzle_emb_ndim: 128
+beta1: 0.9
+beta2: 0.95
+checkpoint_every_eval: true
+checkpoint_path: checkpoints/Abstract_optimizer_processed ACT-torch/HierarchicalReasoningModel_ACTV1
+  ambrosial-orca
+data_path: data/abstract_optimizer_processed
+epochs: 20000
+eval_interval: 1000
+eval_save_outputs: []
+global_batch_size: 16
+lr: 0.0001
+lr_min_ratio: 1.0
+lr_warmup_steps: 2000
+project_name: Abstract_optimizer_processed ACT-torch
+puzzle_emb_lr: 0.01
+puzzle_emb_weight_decay: 0.1
+run_name: HierarchicalReasoningModel_ACTV1 ambrosial-orca
+seed: 0
+weight_decay: 0.1

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff