Spaces:

vishaljoshi24
/

trl-4-dnd

Paused

vishaljoshi24 commited on Sep 10

Commit

731cc49

1 Parent(s): 3488819

trying different LLM

Files changed (1) hide show

quickstart.py CHANGED Viewed

@@ -3,16 +3,13 @@ from trl import GRPOTrainer
 import os
 dataset = load_dataset("trl-lib/tldr", split="train")
-assert os.path.isfile("trl-lib/tldr")
-with open("trl-lib/tldr", "r") as f:
-    pass
 # Dummy reward function: count the number of unique characters in the completions
 def reward_num_unique_chars(completions, **kwargs):
     return [len(set(c)) for c in completions]
 trainer = GRPOTrainer(
-    model="Qwen/Qwen2-0.5B-Instruct",
     reward_funcs=reward_num_unique_chars,
     train_dataset=dataset,
 )

 import os
 dataset = load_dataset("trl-lib/tldr", split="train")
 # Dummy reward function: count the number of unique characters in the completions
 def reward_num_unique_chars(completions, **kwargs):
     return [len(set(c)) for c in completions]
 trainer = GRPOTrainer(
+    model="openai-community/gpt2",
     reward_funcs=reward_num_unique_chars,
     train_dataset=dataset,
 )