whisper

Runtime error

mskov commited on Dec 13, 2022

Commit

3036933

1 Parent(s): d51a20c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,21 +5,28 @@ import whisper
 from share_btn import community_icon_html, loading_icon_html, share_js
 model = whisper.load_model("tiny")
 def inference(audio):
     audio = whisper.load_audio(audio)
     audio = whisper.pad_or_trim(audio)
     mel = whisper.log_mel_spectrogram(audio).to(model.device)
     _, probs = model.detect_language(mel)
     options = whisper.DecodingOptions(fp16 = False)
     result = whisper.decode(model, mel, options)
     print(result.text)
     return result.text, gr.update(visible=True), gr.update(visible=True), gr.update(visible=True)
@@ -172,6 +179,7 @@ with block:
     with gr.Group():
         with gr.Box():
             with gr.Row().style(mobile_collapse=False, equal_height=True):
                 audio = gr.Audio(
                     label="Input Audio",
                     show_label=False,

 from share_btn import community_icon_html, loading_icon_html, share_js
+# whisper model specification
 model = whisper.load_model("tiny")
 def inference(audio):
+    # load audio data
     audio = whisper.load_audio(audio)
+    # ensure sample is in correct format for inference
     audio = whisper.pad_or_trim(audio)
+    # generate a log-mel spetrogram of the audio data
     mel = whisper.log_mel_spectrogram(audio).to(model.device)
     _, probs = model.detect_language(mel)
+    # decode audio data
     options = whisper.DecodingOptions(fp16 = False)
+    # transcribe speech to text
     result = whisper.decode(model, mel, options)
+    # print audio data as text
     print(result.text)
     return result.text, gr.update(visible=True), gr.update(visible=True), gr.update(visible=True)
     with gr.Group():
         with gr.Box():
             with gr.Row().style(mobile_collapse=False, equal_height=True):
+                # get audio from microphone
                 audio = gr.Audio(
                     label="Input Audio",
                     show_label=False,