File size: 963 Bytes
f072b22
94f6b24
f072b22
7740657
 
 
 
 
 
 
5c991e7
7740657
8853ea0
cecf0bc
8853ea0
cecf0bc
807f8da
8853ea0
 
 
 
dc789e9
94f6b24
 
 
 
cecf0bc
94f6b24
 
5c991e7
 
 
 
94f6b24
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
import streamlit as st
from transformers import MBartForConditionalGeneration, MBart50TokenizerFast

model_name = "facebook/mbart-large-50-one-to-many-mmt"
model = MBartForConditionalGeneration.from_pretrained(model_name)
tokenizer = MBart50TokenizerFast.from_pretrained(model_name, src_lang="en_XX")

st.title("Tradutor de Inglês")
st.write(
    f"Faça a tradução do seu texto em inglês para "
    f"{len(tokenizer.lang_code_to_id.keys())} linguagens!"
)

language = st.selectbox(
   "Lingua de saída: ",
   tokenizer.lang_code_to_id.keys(),
   index=0,
   placeholder="Selecione uma linguagem...",
)

input_text = st.text_area("Texto de entrada:")

model_inputs = tokenizer(input_text, return_tensors="pt")

generated_tokens = model.generate(
    **model_inputs,
    forced_bos_token_id=tokenizer.lang_code_to_id[language]
)

translation = tokenizer.batch_decode(
    generated_tokens,
    skip_special_tokens=True
)

st.write(f'Resultado: {translation}')