Llama3-ChatQA-2-70B / code /arguments.py
root
update README and add code
5c83af4
raw
history blame
7.73 kB
import argparse
import os
def get_args():
parser = argparse.ArgumentParser(description="ChatQA-HF")
## model
# parser.add_argument('--model-folder', type=str, default='/lustre/fsw/portfolios/llmservice/users/pengx/projects/vllm_run/')
# parser.add_argument('--model-name', type=str, default='Llama-3-70B-Instruct-Gradient-262k')
parser.add_argument('--model-folder', type=str, default='/lustre/fsw/portfolios/llmservice/users/pengx/projects/swa_long_pretrain_llama2/checkpoints/applications/long_131072_25_multiturn_qa_blend_commercial_v28_9_multiturn_pp1_hf')
parser.add_argument('--model-name', type=str, default='ChatQA2')
## tokenizer
# parser.add_argument('--tokenizer-path', type=str, default='/lustre/fsw/portfolios/adlr/users/zihanl/inform/ckpts/llama2-tokenizer')
parser.add_argument('--tokenizer-path', type=str, default='/lustre/fsw/portfolios/llmservice/users/pengx/projects/vllm_run/Llama-3-70B-Instruct-Gradient-262k/')
# parser.add_argument('--tokenizer-path', type=str, default='/lustre/fsw/portfolios/llmservice/users/pengx/projects/swa_long_pretrain_llama2/checkpoints/applications/long_131072_25_multiturn_qa_blend_commercial_v28_9_multiturn_pp1_hf')
## dataset path
# parser.add_argument('--data-folder', type=str, default='/lustre/fsw/portfolios/adlr/users/zihanl/datasets/foundational_qa/test_benchmarks/multi-turn-qa')
parser.add_argument('--data-folder', type=str, default='/lustre/fs1/portfolios/llmservice/users/pengx/projects/vllm_run/oss_test/')
parser.add_argument('--data-folder-singleturn', type=str, default='/lustre/fsw/portfolios/adlr/users/zihanl/datasets/foundational_qa/test_benchmarks/single-turn-qa')
parser.add_argument('--data-folder-scrolleval', type=str, default='/lustre/fsw/portfolios/adlr/users/zihanl/datasets/foundational_qa/scroll_eval_data')
parser.add_argument('--eval-dataset', type=str, default='')
# parser.add_argument('--doc2dial-path', type=str, default='doc2dial/doc2dial_ftdragon_chatgptgen7k_chunk150_QA_test.json')
# parser.add_argument('--convfinqa-path', type=str, default='convfinqav3/convfinqav3_QA_dev.json')
# parser.add_argument('--convfinqa-path', type=str, default='convfinqa_general/convfinqa_general_QA_dev.json')
# parser.add_argument('--quac-path', type=str, default='quac/quac_ftdragon_chatgptgen7k_chunk150_QA_test.json')
# parser.add_argument('--qrecc-path', type=str, default='qrecc/qrecc_ftdragon_chatgptgen7k_chunk150_QA_test.json')
# parser.add_argument('--doqa-cooking-path', type=str, default='doqa/doqa_cooking_QA_test.json')
# parser.add_argument('--doqa-travel-path', type=str, default='doqa/doqa_travel_QA_test.json')
# parser.add_argument('--doqa-movies-path', type=str, default='doqa/doqa_movies_QA_test.json')
# parser.add_argument('--coqa-path', type=str, default='coqa/coqa_QA_dev.json')
# # parser.add_argument('--hybridial-path', type=str, default='HybridDial/HybridDial_fqa_test.json')
# parser.add_argument('--hybridial-path', type=str, default='HybridDial_general/HybridDial_general_QA_test.json')
# # parser.add_argument('--sqa-path', type=str, default='sqa/sqa_QA_test.json')
# parser.add_argument('--sqa-path', type=str, default='sqa_general/sqa_general_QA_test.json')
# parser.add_argument('--topiocqa-path', type=str, default='topiocqa/topiocqa_dev_retrieval_dragon_ft_chatgptgen7k.json')
# parser.add_argument('--inscit-path', type=str, default='inscit/inscit_dev_retrieval_dragon_ft_chatgptgen7k_with_topic.json')
parser.add_argument('--doc2dial-path', type=str, default='doc2dial/test.json')
parser.add_argument('--convfinqa-path', type=str, default='convfinqa/dev.json')
parser.add_argument('--quac-path', type=str, default='quac/test.json')
parser.add_argument('--qrecc-path', type=str, default='qrecc/test.json')
parser.add_argument('--doqa-cooking-path', type=str, default='doqa/test_cooking.json')
parser.add_argument('--doqa-travel-path', type=str, default='doqa/test_travel.json')
parser.add_argument('--doqa-movies-path', type=str, default='doqa/test_movies.json')
parser.add_argument('--coqa-path', type=str, default='coqa/dev.json')
parser.add_argument('--hybridial-path', type=str, default='hybridial/test.json')
parser.add_argument('--sqa-path', type=str, default='sqa/test.json')
parser.add_argument('--topiocqa-path', type=str, default='topiocqa/dev.json')
parser.add_argument('--inscit-path', type=str, default='inscit/dev.json')
parser.add_argument('--kilt-nq-path', type=str, default='kilt/nq/test.json')
parser.add_argument('--kilt-tqa-path', type=str, default='kilt/tqa/test.json')
parser.add_argument('--kilt-hotpotqa-path', type=str, default='kilt/hotpotqa/test.json')
# parser.add_argument('--kilt-hotpotqa-path', type=str, default='kilt/hotpotqa_rerank/test.json')
parser.add_argument('--nq-path', type=str, default='nq_dragon_retrieved/test.json')
parser.add_argument('--tqa-path', type=str, default='triviaqa_dragon_retrieved/test.json')
parser.add_argument('--hotpotqa-path', type=str, default='hotpotqa_dragon_retrieved/test.json')
## scroll eval
parser.add_argument('--scroll-hotpotqa-chunk1200-path', type=str, default='hotpotqa.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-musique-chunk1200-path', type=str, default='musique.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-qasper-chunk1200-path', type=str, default='qasper.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-narrative_qa-chunk1200-path', type=str, default='narrative_qa.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-quality-chunk1200-path', type=str, default='quality.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-multifieldqa_en-chunk1200-path', type=str, default='multifieldqa_en.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-qmsum-chunk1200-path', type=str, default='qmsum.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-hotpotqa-chunk300-path', type=str, default='hotpotqa.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-musique-chunk300-path', type=str, default='musique.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-qasper-chunk300-path', type=str, default='qasper.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-narrative_qa-chunk300-path', type=str, default='narrative_qa.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-quality-chunk300-path', type=str, default='quality.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-multifieldqa_en-chunk300-path', type=str, default='multifieldqa_en.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--scroll-qmsum-chunk300-path', type=str, default='qmsum.e5_mistral_retriever_chunkbysents1200/test.json')
parser.add_argument('--sample-input-file', type=str, default='')
parser.add_argument("--use-retrieved-neighbours", action='store_true', default=False,
help='Use retrieved neighbours')
## others
parser.add_argument('--max-seq-length', type=int, default=128000)
parser.add_argument('--num-ctx', type=int, default=5)
parser.add_argument('--start-idx', type=int, default=-1)
parser.add_argument('--end-idx', type=int, default=-1)
parser.add_argument('--max-tokens', type=int, default=64)
args = parser.parse_args()
return args