Spaces:

Cicciokr
/

AIGenLatinText

Sleeping

App Files Files Community

Cicciokr commited on Feb 10

Commit

6634984

verified ·

1 Parent(s): 7dfff7c

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -12

app.py CHANGED Viewed

@@ -52,24 +52,23 @@ input_text = st.text_area(
 model_name = "Cicciokr/BART-la-s"
 model = BartForConditionalGeneration.from_pretrained(model_name)
 tokenizer = BartTokenizer.from_pretrained(model_name)
-#tokenizer.pad_token_id = tokenizer.eos_token_id
 model_name_mio = "Cicciokr/BART-CC100-la"
 model_mio = BartForConditionalGeneration.from_pretrained(model_name_mio)
 tokenizer_mio = BartTokenizer.from_pretrained(model_name_mio)
-#tokenizer_mio.pad_token_id = tokenizer_mio.eos_token_id
 generator = pipeline("text2text-generation", model=model, tokenizer=tokenizer)
-#generator_mio = pipeline("text2text-generation", model=model_mio, tokenizer=tokenizer_mio)
 # Se l'utente ha inserito (o selezionato) un testo
 if input_text:
     # Sostituiamo [MASK] con <mask> (lo tokenizer Roberta se lo aspetta così)
     #prompt = "Sostituisci la scritta [MASK] con le parole in latino mancanti per completare la frase: "+input_text
-    inputs = tokenizer(input_text, return_tensors="pt")
     output = generator(
-        input_text,
-        forced_bos_token_id=tokenizer.bos_token_id,
         num_return_sequences=1,
         top_k=50,  # 🔹 Maggiore varietà nelle scelte
         top_p=0.95,  # 🔹 Nucleus sampling per migliorare il realismo
@@ -88,10 +87,9 @@ if input_text:
     #st.write(f" Frase predetta: {tokenizer.decode(output[0], skip_special_tokens=True)}\n")
     #print(output)
     st.write(f" -----------------------------------------------------------\n")
-    inputs_mio = tokenizer_mio(input_text, return_tensors="pt")
-    output_mio = model_mio.generate(
-        **inputs_mio,
-        forced_bos_token_id=tokenizer.bos_token_id,
         num_return_sequences=1,
         top_k=50,  # 🔹 Maggiore varietà nelle scelte
         top_p=0.95,  # 🔹 Nucleus sampling per migliorare il realismo
@@ -100,7 +98,7 @@ if input_text:
         max_length=50  # 🔹 Previene ripetizioni infinite
     )
     print(output_mio)
-    generated_text_mio = tokenizer_mio.decode(output[0], skip_special_tokens=True)
-    #generated_text_mio = output_mio[0]["generated_text"]
     st.subheader("Risultato BART CC100:")
     st.write(f" Frase predetta: {generated_text_mio}\n")

 model_name = "Cicciokr/BART-la-s"
 model = BartForConditionalGeneration.from_pretrained(model_name)
 tokenizer = BartTokenizer.from_pretrained(model_name)
+tokenizer.pad_token_id = tokenizer.eos_token_id
 model_name_mio = "Cicciokr/BART-CC100-la"
 model_mio = BartForConditionalGeneration.from_pretrained(model_name_mio)
 tokenizer_mio = BartTokenizer.from_pretrained(model_name_mio)
+tokenizer_mio.pad_token_id = tokenizer_mio.eos_token_id
 generator = pipeline("text2text-generation", model=model, tokenizer=tokenizer)
+generator_mio = pipeline("text2text-generation", model=model_mio, tokenizer=tokenizer_mio)
 # Se l'utente ha inserito (o selezionato) un testo
 if input_text:
     # Sostituiamo [MASK] con <mask> (lo tokenizer Roberta se lo aspetta così)
     #prompt = "Sostituisci la scritta [MASK] con le parole in latino mancanti per completare la frase: "+input_text
+    #inputs = tokenizer(input_text, return_tensors="pt")
     output = generator(
+        input_text,
         num_return_sequences=1,
         top_k=50,  # 🔹 Maggiore varietà nelle scelte
         top_p=0.95,  # 🔹 Nucleus sampling per migliorare il realismo
     #st.write(f" Frase predetta: {tokenizer.decode(output[0], skip_special_tokens=True)}\n")
     #print(output)
     st.write(f" -----------------------------------------------------------\n")
+    #inputs_mio = tokenizer_mio(input_text, return_tensors="pt")
+    output_mio = generator_mio(
+        input_text,
         num_return_sequences=1,
         top_k=50,  # 🔹 Maggiore varietà nelle scelte
         top_p=0.95,  # 🔹 Nucleus sampling per migliorare il realismo
         max_length=50  # 🔹 Previene ripetizioni infinite
     )
     print(output_mio)
+    #generated_text_mio = tokenizer_mio.decode(output[0], skip_special_tokens=True)
+    generated_text_mio = output_mio[0]["generated_text"]
     st.subheader("Risultato BART CC100:")
     st.write(f" Frase predetta: {generated_text_mio}\n")