Spaces:

inflaton-ai
/

logical-reasoning

Build error

inflaton commited on Jul 16, 2024

Commit

4a18d7a

1 Parent(s): 127b0e9

llama3 p2 epoch 1 results

Files changed (3) hide show

llama-factory/config/llama3-8b_lora_sft_bf16-p1.yaml CHANGED Viewed

@@ -25,7 +25,7 @@ output_dir: saves/llama3-8b/lora/sft_bf16_p1_full
 logging_steps: 10
 save_steps: 175
 plot_loss: true
-#overwrite_output_dir: true
 ### train
 per_device_train_batch_size: 16

 logging_steps: 10
 save_steps: 175
 plot_loss: true
+overwrite_output_dir: true
 ### train
 per_device_train_batch_size: 16

results/llama3-8b_lora_sft_bf16-p2.csv CHANGED Viewed

The diff for this file is too large to render. See raw diff

scripts/eval-mgtv-llama3_8b.sh CHANGED Viewed

@@ -17,7 +17,6 @@ grep MemTotal /proc/meminfo
 #cd ../LLaMA-Factory && pip install -e .[torch,bitsandbytes]
 export LOGICAL_REASONING_DATA_PATH=datasets/mgtv
-export START_EPOCH=1
 export RESIZE_TOKEN_EMBEDDINGS=true
 #export MODEL_NAME=FlagAlpha/Llama3-Chinese-8B-Instruct
@@ -27,11 +26,13 @@ export MODEL_PREFIX=llama3-8b_lora_sft_bf16
 export LOGICAL_REASONING_RESULTS_PATH=results/$MODEL_PREFIX-p1.csv
 export ADAPTER_PATH_BASE=llama-factory/saves/llama3-8b/lora/sft_bf16_p1_full
 export USING_P1_PROMPT_TEMPLATE=true
 echo "Eval $MODEL_NAME with $ADAPTER_PATH_BASE"
-python llm_toolkit/eval_logical_reasoning_all_epochs.py
 export LOGICAL_REASONING_RESULTS_PATH=results/$MODEL_PREFIX-p2.csv
 export ADAPTER_PATH_BASE=llama-factory/saves/llama3-8b/lora/sft_bf16_p2_full
 export USING_P1_PROMPT_TEMPLATE=false
 echo "Eval $MODEL_NAME with $ADAPTER_PATH_BASE"
 python llm_toolkit/eval_logical_reasoning_all_epochs.py

 #cd ../LLaMA-Factory && pip install -e .[torch,bitsandbytes]
 export LOGICAL_REASONING_DATA_PATH=datasets/mgtv
 export RESIZE_TOKEN_EMBEDDINGS=true
 #export MODEL_NAME=FlagAlpha/Llama3-Chinese-8B-Instruct
 export LOGICAL_REASONING_RESULTS_PATH=results/$MODEL_PREFIX-p1.csv
 export ADAPTER_PATH_BASE=llama-factory/saves/llama3-8b/lora/sft_bf16_p1_full
 export USING_P1_PROMPT_TEMPLATE=true
+export START_EPOCH=3
 echo "Eval $MODEL_NAME with $ADAPTER_PATH_BASE"
+#python llm_toolkit/eval_logical_reasoning_all_epochs.py
 export LOGICAL_REASONING_RESULTS_PATH=results/$MODEL_PREFIX-p2.csv
 export ADAPTER_PATH_BASE=llama-factory/saves/llama3-8b/lora/sft_bf16_p2_full
 export USING_P1_PROMPT_TEMPLATE=false
+export START_EPOCH=1
 echo "Eval $MODEL_NAME with $ADAPTER_PATH_BASE"
 python llm_toolkit/eval_logical_reasoning_all_epochs.py