Spaces:

ImPolymath
/

demorrha

Paused

0x07CB commited on Feb 22

Commit

2978bdc

unverified ·

1 Parent(s): 25220e3

Amélioration de la fonction de transcription vocale Hugging Face avec support des fichiers IO et documentation

Files changed (1) hide show

core/speech_to_text.py CHANGED Viewed

@@ -16,30 +16,36 @@ from typing import Union
 from core.DetectLanguage import detect_language
-def huggingface_endpoints_stt(fichier_audio: str) -> str:
     # Définir l'URL de l'endpoint d'inférence sur Hugging Face
     API_URL = f"{getenv('HF_WHISPER_ENDPOINT')}"
     # Inclure votre token d'accès Hugging Face dans les en-têtes de la requête
     headers = {
         "Authorization": f"Bearer {getenv('HF_API_TOKEN')}"
     }
-    """
-    Envoie un fichier audio au modèle Whisper et renvoie la transcription textuelle.
-    Arguments:
-    fichier_audio (str): Chemin vers le fichier audio à envoyer pour la transcription.
-    Retour:
-    str: Texte transcrit à partir de l'audio.
-    """
     # Ajouter le type de contenu audio à l'en-tête de la requête
-    headers["Content-Type"] = f"audio/{fichier_audio.split('.')[-1]}"
     # Ouvrir le fichier audio en mode binaire
-    with open(fichier_audio, "rb") as audio:
         # Envoyer une requête POST à l'API avec le fichier audio
         response = requests.post(API_URL, headers=headers, data=audio)

 from core.DetectLanguage import detect_language
+def huggingface_endpoints_stt(
+        filepath: Union[str, IO]
+    ) -> str:
+    """
+    Transcrit un fichier audio en texte en utilisant l'API Hugging Face.
+    Args:
+        filepath (Union[str, IO]): Chemin vers le fichier audio ou objet IO contenant l'audio à transcrire.
+    Returns:
+        str: Le texte transcrit à partir de l'audio.
+    Raises:
+        Exception: Si une erreur survient lors de l'appel à l'API Hugging Face.
+    """
+    file_path = filepath if isinstance(filepath, str) else filepath.name
     # Définir l'URL de l'endpoint d'inférence sur Hugging Face
     API_URL = f"{getenv('HF_WHISPER_ENDPOINT')}"
     # Inclure votre token d'accès Hugging Face dans les en-têtes de la requête
     headers = {
         "Authorization": f"Bearer {getenv('HF_API_TOKEN')}"
     }
     # Ajouter le type de contenu audio à l'en-tête de la requête
+    headers["Content-Type"] = f"audio/{file_path.split('.')[-1]}"
     # Ouvrir le fichier audio en mode binaire
+    with open(file_path, "rb") as audio:
         # Envoyer une requête POST à l'API avec le fichier audio
         response = requests.post(API_URL, headers=headers, data=audio)