Upload folder using huggingface_hub

Files changed (3) hide show

checkpoints/256.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ff06e50facdc682b3b5a9c6dc88a5cf4336b061a8fa82f1250dbcb8fd38f4bdd
+size 2609241188

config.json ADDED Viewed

+{
+    "dim": 1024,
+    "n_layer": 24,
+    "n_head": 16,
+    "n_kv_head": null,
+    "multiple_of": 256,
+    "ffn_dim_multiplier": null,
+    "rope_base": 10000,
+    "norm_eps": 1e-05,
+    "initializer_range": 0.02,
+    "token_dropout_p": 0.1,
+    "attn_dropout_p": 0.0,
+    "resid_dropout_p": 0.1,
+    "ffn_dropout_p": 0.1,
+    "drop_path_rate": 0.0,
+    "num_classes": 1000,
+    "caption_dim": 2048,
+    "class_dropout_prob": 0.1,
+    "model_type": "c2i",
+    "vocab_size": 8192,
+    "cls_token_num": 1,
+    "block_size": 256,
+    "max_batch_size": 32,
+    "max_seq_len": 2048,
+    "learnable_tok_embeddings": true,
+    "group_size": 8,
+    "causal_num": null
+}

config.yaml ADDED Viewed

+config: configs/ar_l.yaml
+code_path:
+gpt_model: GPT-L
+gpt_ckpt:
+finetune: false
+model_weight_strict: true
+gpt_type: c2i
+ema: true
+cls_token_num: 1
+dropout_p: 0.1
+token_dropout_p: 0.1
+drop_path_rate: 0.0
+compile: true
+results_dir:
+data_path: ImageNet2012/train
+dataset: imagenet_code
+vq_path:
+vq_ema: false
+image_size:
+num_classes: 1000
+epochs: 300
+lr: 1e-4
+warmup_steps:
+warmup_ratio: 0.05
+weight_decay: 5e-2
+beta1: 0.9
+beta2: 0.95
+max_grad_norm: 1.0
+global_batch_size: 512
+global_seed: 0
+num_workers: 24
+log_every: 50
+ckpt_every: 5000
+save_epochs: 2
+mixed_precision: bf16
+learnable_tok_embeddings: true
+resume_from_newest_ckpt: true
+debug_mode: false
+correction_prob: 0.3
+rank: 0
+world_size: 8
+gpu: 0
+dist_url: env://
+distributed: true
+dist_backend: nccl