Spaces:

pheodoraa
/

speechbrain

Sleeping

pheodoraa commited on Mar 17

Commit

03bcefe

verified ·

1 Parent(s): b8590a9

Fix EncoderASR.transcribe_batch() error

Files changed (1) hide show

app.py CHANGED Viewed

@@ -22,12 +22,16 @@ def transcribe(audio):
         # Load audio
         waveform, sample_rate = torchaudio.load(audio)
-        # Ensure correct sample rate (16kHz expected)
         if sample_rate != 16000:
-            waveform = torchaudio.transforms.Resample(orig_freq=sample_rate, new_freq=16000)(waveform)
         # Transcribe
-        transcription = asr_model.transcribe_batch(waveform)
         return transcription[0]
     except Exception as e:

         # Load audio
         waveform, sample_rate = torchaudio.load(audio)
+        # Ensure correct sample rate (16kHz expected by the model)
         if sample_rate != 16000:
+            resampler = torchaudio.transforms.Resample(orig_freq=sample_rate, new_freq=16000)
+            waveform = resampler(waveform)
+        # Compute waveform length in seconds relative to batch size
+        wav_lens = torch.tensor([waveform.shape[1] / 16000], dtype=torch.float32)
         # Transcribe
+        transcription = asr_model.transcribe_batch(waveform, wav_lens)
         return transcription[0]
     except Exception as e: