Spaces:

Tarive
/

HRM-anchoring-bias-model

Running

HRM-anchoring-bias-model / all_config.yaml

Upload 7 files

b829e8f verified 24 days ago

867 Bytes

	arch:
	H_cycles: 2
	H_layers: 4
	L_cycles: 2
	L_layers: 4
	expansion: 4
	halt_exploration_prob: 0.1
	halt_max_steps: 16
	hidden_size: 512
	loss:
	loss_type: stablemax_cross_entropy
	name: losses@ACTLossHead
	name: hrm.hrm_act_v1@HierarchicalReasoningModel_ACTV1
	num_heads: 8
	pos_encodings: rope
	puzzle_emb_ndim: 128
	beta1: 0.9
	beta2: 0.95
	checkpoint_every_eval: true
	checkpoint_path: checkpoints/Abstract_optimizer_processed ACT-torch/HierarchicalReasoningModel_ACTV1
	ambrosial-orca
	data_path: data/abstract_optimizer_processed
	epochs: 20000
	eval_interval: 1000
	eval_save_outputs: []
	global_batch_size: 16
	lr: 0.0001
	lr_min_ratio: 1.0
	lr_warmup_steps: 2000
	project_name: Abstract_optimizer_processed ACT-torch
	puzzle_emb_lr: 0.01
	puzzle_emb_weight_decay: 0.1
	run_name: HierarchicalReasoningModel_ACTV1 ambrosial-orca
	seed: 0
	weight_decay: 0.1