Spaces:

united-link
/

formosan-asr

Running on Zero

App Files Files Community

txya900619 commited on May 12

Commit

1852d76

1 Parent(s): f6358f1

feat: upper first char and add final punc

Browse files

Files changed (1) hide show

app.py +29 -13

app.py CHANGED Viewed

@@ -1,8 +1,10 @@
 import gradio as gr
 import torch
 from omegaconf import OmegaConf
 from transformers import pipeline
-import spaces
 device = "cuda" if torch.cuda.is_available() else "cpu"
 torch_dtype = torch.float16 if torch.cuda.is_available() else torch.float32
@@ -19,46 +21,60 @@ def load_pipe(model_id: str):
         device=device,
     )
 OmegaConf.register_new_resolver("load_pipe", load_pipe)
 models_config = OmegaConf.to_object(OmegaConf.load("configs/models.yaml"))
 @spaces.GPU
 def automatic_speech_recognition(model_id: str, dialect_id: str, audio_file: str):
     model = models_config[model_id]["model"]
     generate_kwargs = {
         "task": "transcribe",
         "language": "id",
         "num_beams": 5,
     }
     if models_config[model_id]["dialect_mapping"] is not None:
-        generate_kwargs["prompt_ids"] = torch.from_numpy(model.tokenizer.get_prompt_ids(dialect_id)).to(
-            device
-        )
-    return model(audio_file, generate_kwargs=generate_kwargs)["text"].replace(f" {dialect_id}", "")
 def when_model_selected(model_id: str):
     model_config = models_config[model_id]
-    if model_config["dialect_mapping"] is not None:
         dialect_drop_down_choices = [
             (k, v) for k, v in model_config["dialect_mapping"].items()
         ]
         return gr.update(
             choices=dialect_drop_down_choices,
             value=dialect_drop_down_choices[0][1],
         )
     else:
-        return gr.update(
-            visible=False
-        )
 def get_title():
     with open("DEMO.md") as tong:
-        return tong.readline().strip('# ')
 demo = gr.Blocks(
     title=get_title(),
@@ -90,7 +106,7 @@ with demo:
         ],
         # value=list(models_config[default_model_id]["dialect_mapping"].values())[0],
         label="族別",
-        visible=False
     )
     model_drop_down.input(

+import re
 import gradio as gr
+import spaces
 import torch
 from omegaconf import OmegaConf
 from transformers import pipeline
 device = "cuda" if torch.cuda.is_available() else "cpu"
 torch_dtype = torch.float16 if torch.cuda.is_available() else torch.float32
         device=device,
     )
 OmegaConf.register_new_resolver("load_pipe", load_pipe)
 models_config = OmegaConf.to_object(OmegaConf.load("configs/models.yaml"))
 @spaces.GPU
 def automatic_speech_recognition(model_id: str, dialect_id: str, audio_file: str):
     model = models_config[model_id]["model"]
     generate_kwargs = {
         "task": "transcribe",
         "language": "id",
         "num_beams": 5,
     }
     if models_config[model_id]["dialect_mapping"] is not None:
+        generate_kwargs["prompt_ids"] = torch.from_numpy(
+            model.tokenizer.get_prompt_ids(dialect_id)
+        ).to(device)
+    result = model(audio_file, generate_kwargs=generate_kwargs)["text"].replace(
+        f" {dialect_id}", ""
+    )
+    if result[-1] not in ".!?":
+        result = result + "."
+    sentences = re.split(r"[.!?] ", result)
+    for i in range(len(sentences)):
+        sentences[i] = sentences[i][0].upper() + sentences[i][1:]
+    return " ".join(sentences)
 def when_model_selected(model_id: str):
     model_config = models_config[model_id]
+    if model_config["dialect_mapping"] is not None:
         dialect_drop_down_choices = [
             (k, v) for k, v in model_config["dialect_mapping"].items()
         ]
         return gr.update(
             choices=dialect_drop_down_choices,
             value=dialect_drop_down_choices[0][1],
         )
     else:
+        return gr.update(visible=False)
 def get_title():
     with open("DEMO.md") as tong:
+        return tong.readline().strip("# ")
 demo = gr.Blocks(
     title=get_title(),
         ],
         # value=list(models_config[default_model_id]["dialect_mapping"].values())[0],
         label="族別",
+        visible=False,
     )
     model_drop_down.input(