artemnech
/

enrut5-base

@@ -4,10 +4,9 @@ tags:
 - russian
 license: mit
 widget:
-- text: "translate ru to en: Интересный момент. Модель не видела русских диалогов, но может их понимать"
 ---
-This pruned model of mt5-base [google/mt5-base](https://huggingface.co/google/mt5-base) with only some Rusian and English embeddings left.
 The model has been fine-tuned for several tasks:
 * translation (opus100 dataset)
@@ -28,28 +27,32 @@ tokenizer = AutoTokenizer.from_pretrained(model_name)
 def generate(text, **kwargs):
     model.eval()
-    inputs = tokenizer(text, return_tensors='pt')
     with torch.no_grad():
         hypotheses = model.generate(**inputs,  **kwargs)
     return tokenizer.decode(hypotheses[0], skip_special_tokens=True)
-print(generate('translate ru to en: Интересный момент. Модель не видела русских диалогов, но может их понимать', num_beams=4,))
-# The Model didn't see Russian dialogues, but can understand them.
-print(generate("translate en to ru: The Model didn't see Russian dialogues, but can understand them.", num_beams=4,))
-# Модель не видела русских диалога, но может понимать их.
 print(generate('dialog: user1>>: Hello', num_beams=2))
 # Hi
 print(generate('dialog: user1>>: Hello user2>>: Hi user1>>: Would you like to drink something?', num_beams=2))
-# I'd like to drink a cup of coffee.
-#An interesting point. The model has not seen Russian dialogues, but can understand them
-print(generate('dialog: user1>>: Привет'))
-# Hi
-print(generate('dialog: user1>>: Привет user2>>: Hi user1>>: Хочешь выпить что-нибудь?', num_beams=2))
-# I'd like to have a cup of coffee.
 ```

 - russian
 license: mit
 widget:
+- text: "translate en-ru: I'm afraid that I won't finish the report on time."
 ---
+This is mt5-base model [google/mt5-base](https://huggingface.co/google/mt5-base) in which only Russian and English tokens are left
 The model has been fine-tuned for several tasks:
 * translation (opus100 dataset)
 def generate(text, **kwargs):
     model.eval()
+    inputs = tokenizer(text, return_tensors='pt').to(model.device)
     with torch.no_grad():
         hypotheses = model.generate(**inputs,  **kwargs)
     return tokenizer.decode(hypotheses[0], skip_special_tokens=True)
+print(generate('translate ru-en: Я боюсь, что я не завершу доклад в ближайшее время.', num_beams=4,))
+# I fear I'm not going to complete the report in the near future.
+print(generate("translate en-ru: I'm afraid that I won't finish the report on time.", num_beams=4, max_length = 30))
+# Я боюсь, что я не завершу доклад в ближайшее время.
 print(generate('dialog: user1>>: Hello', num_beams=2))
 # Hi
 print(generate('dialog: user1>>: Hello user2>>: Hi user1>>: Would you like to drink something?', num_beams=2))
+# I would like to drink a glass of wine.
+from collections import deque
+context =deque([], maxlen=6)
+while True:
+    text = input()
+    text = 'user1>>: ' + text
+    context.append(text)
+    answ = generate('dialog: ' + ' '.join(context), num_beams=3, do_sample = True, temperature=1.5)
+    context.append('user2>>: ' + answ)
+    print('bot: ', answ)
 ```