Add files using upload-large-folder tool

Browse files

Files changed (11) hide show

.gitattributes +9 -0
Qwen2.5-1.5B/.metadata +3 -0
Qwen2.5-1.5B/__0_0.distcp +3 -0
Qwen2.5-1.5B/__1_0.distcp +3 -0
Qwen2.5-1.5B/__2_0.distcp +3 -0
Qwen2.5-1.5B/__3_0.distcp +3 -0
Qwen2.5-1.5B/__4_0.distcp +3 -0
Qwen2.5-1.5B/__5_0.distcp +3 -0
Qwen2.5-1.5B/__6_0.distcp +3 -0
Qwen2.5-1.5B/__7_0.distcp +3 -0
Qwen2.5-1.5B/train_params.yaml +57 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,12 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+Qwen2.5-1.5B/.metadata filter=lfs diff=lfs merge=lfs -text
+Qwen2.5-1.5B/__1_0.distcp filter=lfs diff=lfs merge=lfs -text
+Qwen2.5-1.5B/__2_0.distcp filter=lfs diff=lfs merge=lfs -text
+Qwen2.5-1.5B/__4_0.distcp filter=lfs diff=lfs merge=lfs -text
+Qwen2.5-1.5B/__3_0.distcp filter=lfs diff=lfs merge=lfs -text
+Qwen2.5-1.5B/__6_0.distcp filter=lfs diff=lfs merge=lfs -text
+Qwen2.5-1.5B/__0_0.distcp filter=lfs diff=lfs merge=lfs -text
+Qwen2.5-1.5B/__5_0.distcp filter=lfs diff=lfs merge=lfs -text
+Qwen2.5-1.5B/__7_0.distcp filter=lfs diff=lfs merge=lfs -text

Qwen2.5-1.5B/.metadata ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b09b64774765b2c6e16f29304f5cf3b2c0c48d4a647683fdb36fcfcd2c43eab9
+size 520434

Qwen2.5-1.5B/__0_0.distcp ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0aecd67dbd4f600d25446177fad532d4884c61ef4a60d7101fa0b8f20e73d43e
+size 888538516

Qwen2.5-1.5B/__1_0.distcp ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:169852281a434038b77a0b4e5f30b6e542be8d9ae996507c0c028f7f1448ed66
+size 888538516

Qwen2.5-1.5B/__2_0.distcp ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b06e6b137ee0e0417caeeea476030725c357da85e34a82d8704e798a2349617
+size 888538516

Qwen2.5-1.5B/__3_0.distcp ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:09607fd6d6bd5bb7260a16215e1e72a40de99a19788db2efe25fd1ed52c4a984
+size 888538516

Qwen2.5-1.5B/__4_0.distcp ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:15aed2aa0661ebd4ab218fb6991bb4aff1504df5c30ed90efac8f2180de460be
+size 888538516

Qwen2.5-1.5B/__5_0.distcp ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b4324100ac7283ca7981b6aa9d7decb711723aa349de7d839fd1850dcfa09869
+size 888538516

Qwen2.5-1.5B/__6_0.distcp ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bec0628cf04555fcfb286bf60d2dda1d52c03cb5bf162e905b4747419789c941
+size 888538516

Qwen2.5-1.5B/__7_0.distcp ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:41f4fb289d9eee3c4339844e5b946b88aef54b94a075fe37209ca55a8063bc40
+size 888452500

Qwen2.5-1.5B/train_params.yaml ADDED Viewed

	@@ -0,0 +1,57 @@

+add_ctxemb: 'False'
+add_vocab: 'False'
+all_gather: 'true'
+batch_size_training: '16'
+checkpoint_type: StateDictType.SHARDED_STATE_DICT
+clipping_norm: '-1.0'
+compare: 'False'
+cpu_np_head: 'False'
+ctx_proj_layer: 'False'
+ctx_use_peft: 'False'
+dataset: llava_qwen_selfrag_single_dataset
+dist_checkpoint_folder: qwen1_5.full.prompt_llava.no_mask.no_context.without_sp_epoch2
+dist_checkpoint_root_folder: /apdcephfs_sh2/share_300000800/user/kaixinma/amylee/RedPajama-Data/img/results
+enable_fsdp: 'True'
+freeze_ctx_encoder: 'False'
+freeze_layers: 'False'
+freeze_question_encoder: 'False'
+from_hf: 'False'
+fsdp_activation_checkpointing: 'True'
+gamma: '0.85'
+load_np_head: 'False'
+low_cpu_fsdp: 'True'
+lr: 2e-05
+memory_bank_length: '0'
+micro_batch_size: '2'
+mixed_precision: 'True'
+model_name: Qwen/Qwen2.5-1.5B
+model_use_peft: 'False'
+natural_form: 'False'
+np_weight: '100.0'
+num_epochs: '3'
+num_freeze_layers: '1'
+num_workers_dataloader: '1'
+one_gpu: 'False'
+optimizer: AdamW
+output_dir: peft_checkpoint
+peft_method: None
+pure_bf16: 'False'
+quantization: 'False'
+question_proj_layer: 'False'
+resume_epoch: '0'
+ret_checkpoint_folder: ''
+ret_first: 'False'
+retriever: ''
+run_validation: 'True'
+save_model: 'True'
+save_optimizer: 'False'
+seed: '2'
+sharding_strategy: ShardingStrategy.FULL_SHARD
+single: 'False'
+target_modules: ''
+token_name: Qwen/Qwen2.5-1.5B
+train: 'True'
+use_fast_kernels: 'False'
+use_fp16: 'False'
+val_batch_size: '1'
+weight_decay: '0.0'