Real_Time_diarization

Sleeping

App Files Files Community

Saiyaswanth007 commited on May 25

Commit

a3ec320

1 Parent(s): 91b17d7

Check point 4

Browse files

Files changed (1) hide show

app.py +18 -4

app.py CHANGED Viewed

@@ -10,12 +10,13 @@ import torchaudio
 from scipy.spatial.distance import cosine
 from RealtimeSTT import AudioToTextRecorder
 from fastapi import FastAPI, APIRouter
-from fastrtc import Stream, AsyncStreamHandler, WebRTC
 import json
 import asyncio
 import uvicorn
 from queue import Queue
 import logging
 # Set up logging
 logging.basicConfig(level=logging.INFO)
@@ -705,8 +706,7 @@ def initialize_system():
             stream = Stream(
                 handler=handler,
                 modality="audio",
-                mode="send-receive",
-                stream_name="audio_stream"  # Match the stream_name in WebRTC component
             )
             # Mount the stream to the FastAPI app
@@ -780,7 +780,6 @@ def create_interface():
                 # Replace standard Audio with WebRTC component
                 audio_component = WebRTC(
                     label="Audio Input",
-                    stream_name="audio_stream",
                     modality="audio",
                     mode="send-receive"
                 )
@@ -912,6 +911,21 @@ def create_interface():
         # Auto-refresh status every 2 seconds
         status_timer = gr.Timer(2)
         status_timer.tick(refresh_status, outputs=[status_output])
     return interface

 from scipy.spatial.distance import cosine
 from RealtimeSTT import AudioToTextRecorder
 from fastapi import FastAPI, APIRouter
+from fastrtc import Stream, AsyncStreamHandler
 import json
 import asyncio
 import uvicorn
 from queue import Queue
 import logging
+from gradio_webrtc import WebRTC
 # Set up logging
 logging.basicConfig(level=logging.INFO)
             stream = Stream(
                 handler=handler,
                 modality="audio",
+                mode="send-receive"
             )
             # Mount the stream to the FastAPI app
                 # Replace standard Audio with WebRTC component
                 audio_component = WebRTC(
                     label="Audio Input",
                     modality="audio",
                     mode="send-receive"
                 )
         # Auto-refresh status every 2 seconds
         status_timer = gr.Timer(2)
         status_timer.tick(refresh_status, outputs=[status_output])
+        # Connect the WebRTC component to our processing function
+        def process_webrtc_audio(audio_data):
+            if audio_data is not None and diarization_system.is_running:
+                try:
+                    # Feed audio to our diarization system
+                    diarization_system.feed_audio(audio_data)
+                except Exception as e:
+                    logger.error(f"Error processing WebRTC audio: {e}")
+            return get_conversation()
+        audio_component.stream(
+            fn=process_webrtc_audio,
+            outputs=[conversation_output]
+        )
     return interface