Spaces:

vishaljoshi24
/

trl-4-dnd

Paused

vishaljoshi24 commited on Aug 8

Commit

4a4b568

1 Parent(s): c3fb598

Amended quickstart.py for better memory allocation

Files changed (2) hide show

app.py CHANGED Viewed

@@ -2,7 +2,6 @@ import os
 import gradio as gr
 api_key = os.getenv("HF_TOKEN")
-os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "expandable_segments:True"
 def start_training():
     os.system("python quickstart.py --model_name_or_path Qwen/Qwen3-0.6B --train_data_dir trl-lib/Capybara --api_key HF_TOKEN" )
     return "Evaluation completed!"

 import gradio as gr
 api_key = os.getenv("HF_TOKEN")
 def start_training():
     os.system("python quickstart.py --model_name_or_path Qwen/Qwen3-0.6B --train_data_dir trl-lib/Capybara --api_key HF_TOKEN" )
     return "Evaluation completed!"

quickstart.py CHANGED Viewed

@@ -1,7 +1,9 @@
 from trl import SFTTrainer
 from datasets import load_dataset
 dataset = load_dataset("trl-lib/Capybara", split="train")
 trainer = SFTTrainer(
     model="Qwen/Qwen3-0.6B",

+import os
 from trl import SFTTrainer
 from datasets import load_dataset
 dataset = load_dataset("trl-lib/Capybara", split="train")
+os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "expandable_segments:True"
 trainer = SFTTrainer(
     model="Qwen/Qwen3-0.6B",