Spaces:

Somalitts
/

STT_Api

Running

Somalitts commited on 24 days ago

Commit

f548f48

verified ·

1 Parent(s): be7c2a1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,38 +1,44 @@
 from fastapi import FastAPI, UploadFile, File
 from fastapi.middleware.cors import CORSMiddleware
 import torchaudio
 import torch
-from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
-import uvicorn
 import io
 app = FastAPI()
-# Allow requests from Flutter (localhost or any domain)
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],
-    allow_credentials=True,
     allow_methods=["*"],
     allow_headers=["*"],
 )
-# Load model and processor once at startup
 processor = Wav2Vec2Processor.from_pretrained("Mustafaa4a/ASR-Somali")
 model = Wav2Vec2ForCTC.from_pretrained("Mustafaa4a/ASR-Somali")
-@app.post("/transcribe")
-async def transcribe_audio(file: UploadFile = File(...)):
-    contents = await file.read()
-    audio_bytes = io.BytesIO(contents)
-    waveform, sample_rate = torchaudio.load(audio_bytes)
     if sample_rate != 16000:
         resampler = torchaudio.transforms.Resample(orig_freq=sample_rate, new_freq=16000)
         waveform = resampler(waveform)
     inputs = processor(waveform.squeeze(), sampling_rate=16000, return_tensors="pt")
     with torch.no_grad():
         logits = model(**inputs).logits

+import os
+os.environ["TRANSFORMERS_CACHE"] = "/tmp/hf-cache"  # Important for Docker
 from fastapi import FastAPI, UploadFile, File
 from fastapi.middleware.cors import CORSMiddleware
 import torchaudio
 import torch
+from transformers import Wav2Vec2Processor, Wav2Vec2ForCTC
 import io
 app = FastAPI()
+# Allow all origins (for Flutter)
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],
     allow_methods=["*"],
     allow_headers=["*"],
 )
+# Load model
 processor = Wav2Vec2Processor.from_pretrained("Mustafaa4a/ASR-Somali")
 model = Wav2Vec2ForCTC.from_pretrained("Mustafaa4a/ASR-Somali")
+@app.get("/")
+async def root():
+    return {"message": "Somali Speech-to-Text API is running."}
+@app.post("/transcribe")
+async def transcribe(file: UploadFile = File(...)):
+    audio_bytes = await file.read()
+    audio_stream = io.BytesIO(audio_bytes)
+    waveform, sample_rate = torchaudio.load(audio_stream)
     if sample_rate != 16000:
         resampler = torchaudio.transforms.Resample(orig_freq=sample_rate, new_freq=16000)
         waveform = resampler(waveform)
     inputs = processor(waveform.squeeze(), sampling_rate=16000, return_tensors="pt")
     with torch.no_grad():
         logits = model(**inputs).logits