Spaces:

v-e-n-o-m
/

urdu-asr-whisper

Sleeping

v-e-n-o-m commited on Apr 12

Commit

d405224

1 Parent(s): c4b6df5

Fix cache permission error for Whisper API

Files changed (4) hide show

.dockerignore ADDED Viewed

+__pycache__
+*.pyc
+*.pyo
+*.pyd
+.Python
+env/
+venv/
+.env
+*.log

Dockerfile CHANGED Viewed

@@ -2,6 +2,12 @@ FROM python:3.10-slim
 WORKDIR /app
 COPY requirements.txt .
 RUN pip install --no-cache-dir -r requirements.txt

 WORKDIR /app
+# Install ffmpeg for audio processing
+RUN apt-get update && apt-get install -y ffmpeg && rm -rf /var/lib/apt/lists/*
+# Create cache directory
+RUN mkdir -p /app/cache && chmod -R 777 /app/cache
 COPY requirements.txt .
 RUN pip install --no-cache-dir -r requirements.txt

app.py CHANGED Viewed

@@ -4,15 +4,21 @@ import torch
 import soundfile as sf
 import io
 import numpy as np
 app = FastAPI()
-# Initialize Whisper pipeline (loaded once at startup)
 pipe = pipeline(
     "automatic-speech-recognition",
     model="openai/whisper-large-v3",
-    torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
-    device="cuda" if torch.cuda.is_available() else "cpu",
 )
 @app.post("/transcribe")

 import soundfile as sf
 import io
 import numpy as np
+import os
 app = FastAPI()
+# Set cache directory
+os.environ["TRANSFORMERS_CACHE"] = "/app/cache"
+os.environ["HF_HOME"] = "/app/cache"
+# Initialize Whisper pipeline (CPU, lower memory)
 pipe = pipeline(
     "automatic-speech-recognition",
     model="openai/whisper-large-v3",
+    torch_dtype=torch.float32,  # CPU compatibility
+    device="cpu",
+    model_kwargs={"use_safetensors": True},
 )
 @app.post("/transcribe")

requirements.txt CHANGED Viewed

@@ -3,4 +3,5 @@ uvicorn==0.23.2
 transformers==4.38.2
 torch==2.0.1
 soundfile==0.12.1
-numpy==1.24.3

 transformers==4.38.2
 torch==2.0.1
 soundfile==0.12.1
+numpy==1.24.3
+librosa==0.10.1