Spaces:

romas-458
/

acr

Sleeping

roman commited on May 22, 2024

Commit

c1dd4e9

1 Parent(s): 33b3376

change app for whisper testing

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,32 +1,34 @@
-# import streamlit as st
-#
-# x = st.slider('Select a value')
-# st.write(x, 'squared is', x * x)
 import streamlit as st
-from transformers import pipeline
-st.write("Starting the app")
-# Load a pre-trained pipeline for text generation
-generator = pipeline('text-generation', model='gpt2')
-st.title('Simple Hugging Face Space with Streamlit')
-# Text input widget
-input_text = st.text_area('Enter your text here:', '')
-if st.button('Generate'):
-    if input_text:
-        # Generate text using the model
-        outputs = generator(input_text, max_length=50, num_return_sequences=1)
-        st.write('Generated Text:')
-        st.write(outputs[0]['generated_text'])
-    else:
-        st.write('Please enter some text to generate.')
-# if __name__ == '__main__':
-#     st.title('ACR')

 import streamlit as st
+import whisper
+import tempfile
+from pydub import AudioSegment
+# Load the Whisper model
+model = whisper.load_model("base")
+st.title("Voice Recognition App using Whisper")
+st.write("Upload an audio file and the Whisper model will transcribe it to text.")
+# File uploader for audio file
+uploaded_file = st.file_uploader("Choose an audio file", type=["wav", "mp3", "m4a"])
+if uploaded_file is not None:
+    # Save the uploaded file temporarily
+    with tempfile.NamedTemporaryFile(delete=False) as temp_file:
+        temp_file.write(uploaded_file.read())
+        temp_file_path = temp_file.name
+    # Convert audio file to a format supported by Whisper (if necessary)
+    audio = AudioSegment.from_file(temp_file_path)
+    temp_wav_path = tempfile.mktemp(suffix=".wav")
+    audio.export(temp_wav_path, format="wav")
+    st.audio(uploaded_file, format="audio/wav")
+    st.write("Transcribing audio...")
+    # Transcribe audio using Whisper model
+    result = model.transcribe(temp_wav_path)
+    st.write("Transcription:")
+    st.write(result["text"])