|
|
|
import argparse |
|
import os |
|
|
|
def get_args(): |
|
parser = argparse.ArgumentParser(description="ChatQA-HF") |
|
|
|
|
|
|
|
|
|
|
|
parser.add_argument('--model-folder', type=str, default='/lustre/fsw/portfolios/llmservice/users/pengx/projects/swa_long_pretrain_llama2/checkpoints/applications/long_131072_25_multiturn_qa_blend_commercial_v28_9_multiturn_pp1_hf') |
|
parser.add_argument('--model-name', type=str, default='ChatQA2') |
|
|
|
|
|
|
|
parser.add_argument('--tokenizer-path', type=str, default='/lustre/fsw/portfolios/llmservice/users/pengx/projects/vllm_run/Llama-3-70B-Instruct-Gradient-262k/') |
|
|
|
|
|
|
|
|
|
parser.add_argument('--data-folder', type=str, default='/lustre/fs1/portfolios/llmservice/users/pengx/projects/vllm_run/oss_test/') |
|
parser.add_argument('--data-folder-singleturn', type=str, default='/lustre/fsw/portfolios/adlr/users/zihanl/datasets/foundational_qa/test_benchmarks/single-turn-qa') |
|
parser.add_argument('--data-folder-scrolleval', type=str, default='/lustre/fsw/portfolios/adlr/users/zihanl/datasets/foundational_qa/scroll_eval_data') |
|
|
|
parser.add_argument('--eval-dataset', type=str, default='') |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
parser.add_argument('--doc2dial-path', type=str, default='doc2dial/test.json') |
|
parser.add_argument('--convfinqa-path', type=str, default='convfinqa/dev.json') |
|
parser.add_argument('--quac-path', type=str, default='quac/test.json') |
|
parser.add_argument('--qrecc-path', type=str, default='qrecc/test.json') |
|
parser.add_argument('--doqa-cooking-path', type=str, default='doqa/test_cooking.json') |
|
parser.add_argument('--doqa-travel-path', type=str, default='doqa/test_travel.json') |
|
parser.add_argument('--doqa-movies-path', type=str, default='doqa/test_movies.json') |
|
parser.add_argument('--coqa-path', type=str, default='coqa/dev.json') |
|
parser.add_argument('--hybridial-path', type=str, default='hybridial/test.json') |
|
parser.add_argument('--sqa-path', type=str, default='sqa/test.json') |
|
parser.add_argument('--topiocqa-path', type=str, default='topiocqa/dev.json') |
|
parser.add_argument('--inscit-path', type=str, default='inscit/dev.json') |
|
|
|
parser.add_argument('--kilt-nq-path', type=str, default='kilt/nq/test.json') |
|
parser.add_argument('--kilt-tqa-path', type=str, default='kilt/tqa/test.json') |
|
parser.add_argument('--kilt-hotpotqa-path', type=str, default='kilt/hotpotqa/test.json') |
|
|
|
|
|
parser.add_argument('--nq-path', type=str, default='nq_dragon_retrieved/test.json') |
|
parser.add_argument('--tqa-path', type=str, default='triviaqa_dragon_retrieved/test.json') |
|
parser.add_argument('--hotpotqa-path', type=str, default='hotpotqa_dragon_retrieved/test.json') |
|
|
|
|
|
parser.add_argument('--scroll-hotpotqa-chunk1200-path', type=str, default='hotpotqa.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-musique-chunk1200-path', type=str, default='musique.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-qasper-chunk1200-path', type=str, default='qasper.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-narrative_qa-chunk1200-path', type=str, default='narrative_qa.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-quality-chunk1200-path', type=str, default='quality.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-multifieldqa_en-chunk1200-path', type=str, default='multifieldqa_en.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-qmsum-chunk1200-path', type=str, default='qmsum.e5_mistral_retriever_chunkbysents1200/test.json') |
|
|
|
parser.add_argument('--scroll-hotpotqa-chunk300-path', type=str, default='hotpotqa.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-musique-chunk300-path', type=str, default='musique.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-qasper-chunk300-path', type=str, default='qasper.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-narrative_qa-chunk300-path', type=str, default='narrative_qa.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-quality-chunk300-path', type=str, default='quality.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-multifieldqa_en-chunk300-path', type=str, default='multifieldqa_en.e5_mistral_retriever_chunkbysents1200/test.json') |
|
parser.add_argument('--scroll-qmsum-chunk300-path', type=str, default='qmsum.e5_mistral_retriever_chunkbysents1200/test.json') |
|
|
|
parser.add_argument('--sample-input-file', type=str, default='') |
|
parser.add_argument("--use-retrieved-neighbours", action='store_true', default=False, |
|
help='Use retrieved neighbours') |
|
|
|
|
|
parser.add_argument('--max-seq-length', type=int, default=128000) |
|
parser.add_argument('--num-ctx', type=int, default=5) |
|
parser.add_argument('--start-idx', type=int, default=-1) |
|
parser.add_argument('--end-idx', type=int, default=-1) |
|
parser.add_argument('--max-tokens', type=int, default=64) |
|
|
|
args = parser.parse_args() |
|
|
|
return args |
|
|