Aananda-giri
/

LLAMA3-Nepali

Model card Files Files and versions Community

Aananda-giri commited on Mar 15

Commit

42609a3

·

verified ·

1 Parent(s): 19fa3b4

Update README.md

Files changed (1) hide show

README.md +14 -10

README.md CHANGED Viewed

@@ -93,7 +93,7 @@ print(f'device: {device}')
 # Load checkpoint
 latest_model_checkpoint = "parameters_300m/model_pg_398000_steps.pth"
-checkpoint = torch.load(latest_model_checkpoint, weights_only=False)
 model.load_state_dict(checkpoint["model_state_dict"])
 ```
@@ -112,24 +112,28 @@ generate_and_print_sample(
 #### Advanced Text Generation
 ```python
-from previous_chapters import generate_and_print_chat
-generated_text = generate_and_print_chat(
     prompt="रामले भात",
     tokenizer=tokenizer,
     chat_tokenizer=chat_tokenizer,
     model=model,
     device=device,
-    max_new_tokens=150,
-    context_length=None,
-    temperature=0.1,
-    top_k=50,
-    top_p=0.9,
     repetition_penalty=1.2,
-    clean_the_text=True
 )
-print("Generated text:\n", generated_text)
 ```

 # Load checkpoint
 latest_model_checkpoint = "parameters_300m/model_pg_398000_steps.pth"
+checkpoint = torch.load(latest_model_checkpoint, map_location=device, weights_only=False)
 model.load_state_dict(checkpoint["model_state_dict"])
 ```
 #### Advanced Text Generation
 ```python
+from previous_chapters import generate_chat_optimized
+import time
+start_time = time.time()
+output_text = generate_chat_optimized(
     prompt="रामले भात",
     tokenizer=tokenizer,
     chat_tokenizer=chat_tokenizer,
     model=model,
+    max_new_tokens=20,
+    context_size=512,
     device=device,
+    temperature=0.3,
+    top_k=5,
+    top_p=None,
+    eos_id=None,
     repetition_penalty=1.2,
+    penalize_len_below=10,
+    batch_size=1  # Added parameter
 )
+print(f"time:{time.time() - start_time}\n output_text: {output_text}")
 ```