Spaces:

mrfakename
/

dia-1.6b

Running on Zero

dia-1.6b / app.py

Update app.py

384a9fc verified about 18 hours ago

1.13 kB

	import spaces
	import gradio as gr
	import soundfile as sf
	import numpy as np
	from dia.model import Dia

	# Load the model once
	model = Dia.from_pretrained("nari-labs/Dia-1.6B")

	@spaces.GPU
	def generate_dialogue(script):
	output = model.generate(script)
	filename = "generated_dialogue.wav"
	sf.write(filename, output, 44100)
	return filename

	with gr.Blocks() as demo:
	gr.Markdown("## 🎙️ Dia - Text to Dialogue Demo")
	gr.Markdown("Enter a multi-speaker script below using `[S1]`, `[S2]`, etc.")

	with gr.Row():
	script_input = gr.Textbox(
	label="Script",
	lines=6,
	value="[S1] Dia is an open weights text to dialogue model. [S2] You get full control over scripts and voices. [S1] Wow. Amazing. (laughs) [S2] Try it now on Git hub or Hugging Face."
	)

	with gr.Row():
	generate_btn = gr.Button("Generate Audio")

	with gr.Row():
	audio_output = gr.Audio(label="Generated Dialogue", type="filepath")

	generate_btn.click(
	fn=generate_dialogue,
	inputs=script_input,
	outputs=audio_output
	)

	demo.launch()