Spaces:

cahodk
/

parler

Sleeping

App Files Files Community

Carsten Høyer commited on Sep 2, 2024

Commit

5dfce18

1 Parent(s): 2e80e92

add print

Browse files

Files changed (1) hide show

app.py +14 -6

app.py CHANGED Viewed

@@ -28,11 +28,16 @@ def greet_json():
     return {"Hello": "World!"}
 # Function to generate audio from text using ParlerTTS
-def generate_audio(text, description="Neutral voice"):
     input_ids = tokenizer(description, return_tensors="pt").input_ids.to(device)
     prompt_input_ids = tokenizer(text, return_tensors="pt").input_ids.to(device)
     generation = model.generate(input_ids=input_ids, prompt_input_ids=prompt_input_ids)
     audio_arr = generation.cpu().numpy().squeeze()
     return audio_arr, model.config.sampling_rate
 # A POST endpoint to receive and parse an array of JSON objects
@@ -40,20 +45,23 @@ def generate_audio(text, description="Neutral voice"):
 async def create_items(items: List[Item]):
     processed_items = []
     for item in items:
         # Generate audio
         audio_arr, sample_rate = generate_audio(item.text)
-        # Create in-memory bytes buffer for audio
-        audio_bytes = io.BytesIO()
-        sf.write(audio_bytes, audio_arr, sample_rate, format="WAV")
-        audio_bytes.seek(0)  # Reset buffer position
         processed_item = {
             "text": item.text,
             "name": item.name,
             "section": item.section,
             "processed": True,
-            "audio": StreamingResponse(audio_bytes, media_type="audio/wav")
         }
         processed_items.append(processed_item)

     return {"Hello": "World!"}
 # Function to generate audio from text using ParlerTTS
+def generate_audio(text, description="Jon's voice is monotone yet slightly fast in delivery, with a very close recording that almost has no background noise."):
+    print("A")
     input_ids = tokenizer(description, return_tensors="pt").input_ids.to(device)
+    print("B")
     prompt_input_ids = tokenizer(text, return_tensors="pt").input_ids.to(device)
+    print("C")
     generation = model.generate(input_ids=input_ids, prompt_input_ids=prompt_input_ids)
+    print("D")
     audio_arr = generation.cpu().numpy().squeeze()
+    print("E")
     return audio_arr, model.config.sampling_rate
 # A POST endpoint to receive and parse an array of JSON objects
 async def create_items(items: List[Item]):
     processed_items = []
     for item in items:
+        print(f"Processing item: {item.text}")
         # Generate audio
+        print("before")
         audio_arr, sample_rate = generate_audio(item.text)
+        print("after")
+        # # Create in-memory bytes buffer for audio
+        # audio_bytes = io.BytesIO()
+        # sf.write(audio_bytes, audio_arr, sample_rate, format="WAV")
+        # audio_bytes.seek(0)  # Reset buffer position
         processed_item = {
             "text": item.text,
             "name": item.name,
             "section": item.section,
             "processed": True,
+            # "audio": StreamingResponse(audio_bytes, media_type="audio/wav")
         }
         processed_items.append(processed_item)