Audio Spaces

hysts 's Collections

Diffusion model Spaces

LLM Spaces

Audio Spaces

updated 3 days ago

Upvote

Runtime error

71

71

Whisper vs Distil-Whisper

📈
Runtime error

951

951

Seamless M4T

📞
Running on A10G

4.95k

4.95k

MusicGen

🎵

Generate music from text descriptions
Runtime error

810

810

Audioldm Text To Audio Generation

🔊

Generate audio from text descriptions
Runtime error

305

305

AudioLDM2 Text2Audio Text2Music Generation

🔊

Generate audio and waveform video from text
Runtime error

221

221

AudioSep

🐠
Running

165

165

Lp Music Caps

🎵

Create music captions from audio files
Running on T4

301

301

Tortoise Tts

🐢

ExpressivText-to-Speech
Runtime error

22

22

All In One

📊
Running on T4

2.59k

2.59k

XTTS

🐸

Generate realistic voice synthesis using text and reference audio
Paused

189

189

Coqui Bark Voice Cloning

🐸
Running on L4

359

359

VALL E X

🎙

Generate audio from text using voice prompts
Running on A10G

192

192

WavJourney

🔥
Paused

264

264

Music To Image

🎶
Runtime error

278

278

MMS

🌍

Transform and identify speech with MMS
Running

586

586

ElevenLabs TTS

🗣

Generate realistic voices from text
Build error

288

288

AudioGPT

🚀
Running on T4

2.3k

2.3k

Bark

🐶

Generate realistic audio from text
Runtime error

36

36

SpeechT5 Speech Recognition Demo

👩
Runtime error

173

173

CoquiTTS (Official)

🐸
Running on L40S

2.24k

2.24k

Whisper

📉

Transcribe audio from microphone, files, or YouTube
Running on CPU Upgrade

635

635

Moe TTS

😊

Generate and convert speech using text and audio inputs
Build error

17

17

YourTTS

🔥
Running

553

553

Talking Face Generation with Multilingual TTS

👄

Generate a talking face video from text
Runtime error

562

562

OpenAI TTS New

📊
Runtime error

167

167

Mustango

🐢
Sleeping

55

55

OWSM Demo

🔊
Running on L4

650

650

StyleTTS 2

🗣

Efficient, fast, and natural text to speech with StyleTTS 2!
Running on T4

393

393

HierSpeech++ (Zero-shot TTS)

⚡

Generate high-quality speech from text using a prompt audio
Sleeping

21

21

Video2music

📚

Generate music for a video based on its content and key
Runtime error

187

187

Whisper Large V2

🤫
Running on T4

64

64

Musicgen Prompt Upsampling

🌖

Generate music from text prompts 🎶
Runtime error

67

67

Qwen-Audio

🎤

Interact with a chatbot using text and audio
Runtime error

515

515

Seamless M4T v2

📞
Running on T4

296

296

Seamless Streaming

📞

Translate text into different languages
Runtime error

51

51

Matcha TTS

🍵

Generate speech from text input
Running on Zero

270

270

MusicGen Streaming

🔥

Generate music from text prompts
Running on T4

352

352

Resemble Enhance

🚀

Enhance and clean audio files
Running on A10G

259

259

Singing Voice Conversion

🎼

Transform your voice into a singer's
Sleeping

50

50

NaturalSpeech2

🎧
Paused

21

21

Create Your Own TTS Dataset

🔥
Sleeping

Podcast Transcription

🐢
Running

1.06k

1.06k

OpenVoice

🤗
Runtime error

95

95

M2UGen Demo

💻
Runtime error

69

69

Pheme

📊
Running

6

6

ESPnet2 TTS

📈

Generate speech from text in multiple languages
Running

22

22

Whisper-WebUI

🚀

Generate subtitles and translate them
Paused

170

170

Image2SFX Comparison

👂

Generates audio environment from an image
Runtime error

380

380

WhisperSpeech

🌬
Build error

146

146

MetaVoice 1B

🗣

A demo of MetaVoice 1B, a new TTS model by MetaVoice.
Running on CPU Upgrade

750

750

TTS Arena V2

🏆

Vote on the latest TTS models!
Paused

172

172

Whisper Speech X DreamTalk

😽

Combine voice cloning and portrait lipsync animation
Running on T4

198

198

Canary 1b

🐤

Transcribe and translate audio into text
Running on T4

456

456

MeloTTS

🗣

Fast, efficient, & multilingual text-to-speech
Running on Zero

291

291

Audio Editing

🎧

Edit audios with text prompts
Runtime error

18

18

ChatMusician

💻
Running on CPU Upgrade

70

70

xVASynth TTS

🧝

CPU powered, low RTF, emotional, multilingual TTS
Running on Zero

179

179

NaturalSpeech3 FACodec

🏃

Convert and reconstruct speech files
Runtime error

25

25

Hey Gemma

☎
Running

70

70

Ratchet + Whisper

🗣
Paused

3

3

AutoSubs

📜

Automatically add on-screen subs to your videos
Build error

161

161

VoiceCraft

📈
Running on Zero

307

307

TangoFlux

🚀

Text to Audio (Sound SFX) Generator
Runtime error

824

824

Parler-TTS

🥖

High-fidelity Text-To-Speech
Runtime error

184

184

Sing an idea ➡️ Music

🔥

Bring song ideas to life
Running on Zero

74

74

Musicgen Songstarter Demo

👁

Generate music using descriptions and optional melody audio
Runtime error

145

145

Whisper JAX

👀

Transcribe or translate audio from microphone, file, or YouTube
Running on Zero

21

21

AudioLCM

🏢

Generate audio from text
Running on Zero

159

159

Stable Audio Live Multiplayer

💻

Generate audio from text prompts
Running on Zero

428

428

Stable Audio Open Zero

🔥

Generate audio from text prompts
Running on Zero

13

13

Make An Audio 3

🐠

Generate audio from text
Runtime error

60

60

Mars5 Space

📉
Runtime error

5

5

Tango Music AF

🎵

Text to Music Generator
Running

100

100

BigVGAN

🔊

Generate high-fidelity audio from input audio waveforms
Runtime error

90

90

SenseVoice

🐠

Transcribe audio with emotions and events
Runtime error

59

59

CosyVoice 300M

📉
Running on Zero

26

26

PicoAudio

📈

Generate audio from text descriptions with timestamps
Build error

6

6

Audio Flamingo Demo

📚
Runtime error

29

29

MusiConGen

🪩
Running

17

17

Mms Zeroshot

🌍

Generate transcript from audio input
Running

189

189

Qwen2 Audio Instruct Demo

🌍

Interact with a multimodal chatbot using text and audio
Running on Zero

147

147

GPT SoVITS V2

🤗

Generate voice from text using reference audio
Running on Zero

263

263

EzAudio

🟣

Generate and edit audio from text prompts
Running on Zero

216

216

OpenMusic

🎶

Generate high-quality music from text descriptions
Running on Zero

515

515

Midi Music Generator

🎼

Generate MIDI music from prompts
Running on Zero

902

902

Whisper Turbo

🤯

Transcribe audio or YouTube videos to text
Running on Zero

312

312

Realtime Whisper Turbo

🤯

Realtime implementation of Whisper large turbo
Running

157

157

Whisper Large V3 Turbo WebGPU

🚀

ML-powered speech recognition directly in your browser
Running on L4

503

503

Fish Speech 1

🏆

Generate audio from text with voice customization
Running on Zero

367

367

TTS Spaces Arena

🤗

Blind vote on HF TTS models!
Runtime error

18

18

Diva Realtime Chat

🗣

Convert spoken words to text and voice assistant responses
Running on Zero

2.33k

2.33k

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Running on Zero

257

257

MaskGCT TTS Demo

😻

MaskGCT TTS Demo
Running on Zero

91

91

MelodyFlow

🎵

Generate music from text and melody
Running on L40S

143

143

Fish Agent

💬

An end-to-end (e2e) Voice Language Model by Fish Audio.
Running

65

65

Nexa Omni Demo

🎧

Generate text from audio input
Runtime error

208

208

CosyVoice2-0.5B

🥳

Generate realistic voice audio from text and audio prompts
Running on Zero

2.61k

2.61k

Kokoro TTS

❤

Upgraded to v1.0!
Running on T4

108

108

Make Custom Voices With KokoroTTS

⚡

Make Custom Voices With KokoroTTS
Running on Zero

299

299

Llasa 3b Tts

🔥

Zero Shot voice cloning with llasa 3b (Unofficial Demo)
Runtime error

12

12

Llasa 1b Multilingual TTS

🌍

Generate speech from text with or without cloning a voice
Running

314

314

Kokoro Text-to-Speech (WebGPU)

🗣

High-quality speech synthesis powered by Kokoro TTS
Running on Zero

40

40

Hibiki Simple

👄

High-Fidelity Simultaneous Speech-To-Speech Translation
Running on Zero

377

377

Zonos

🌍

Generate high-quality audio from text using various controls
Running

66

66

Kokoro Web

🗣

ML-powered speech synthesis directly in your browser
Running on Zero

585

585

Di♪♪Rhythm

🎶

Blazingly Fast and Embarrassingly Simple Song Generation
Running

20

20

Audiobox Aesthetics

📚

Demo for audiobox-aesthetics
Running on Zero

230

230

Spark TTS

🌖

A text-to-speech model powered by SparkAudio and Mobvoi.
Running on Zero

791

791

Sesame CSM

🌱

Conversational speech generation
Running on Zero

198

198

Orpheus TTS

🚀

Try Orpheus TTS here
Running on Zero

31

31

Canary 1B Flash

🐤

Canary 1B Flash demo
Running on Zero

68

68

IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System

🎙

Generate customized voice音频 from text
Sleeping

5

5

AudioMorphix

🌊

Setup and run a Gradio app
Running on Zero

73

73

MegaTTS3 Demo

👋
Running on Zero

113

113

AudioX

👀

Generate audio and video from text prompts
Running on Zero

86

86

Vevo for Zero-shot VC, TTS, and More

🐠

Controllable Zero-Shot Voice Imitation
Running on Zero

1.37k

1.37k

Dia 1.6B

👯

Generate realistic dialogue from a script, using Dia!
Running on Zero

39

39

Aero 1 Audio Demo

💬

Demo for Aero-1-Audio
Running on Zero

35

35

Voila Demo

💻

Chat with a voice-clone AI
Running on Zero

399

399

ACE Step

😻

A Step Towards Music Generation Foundation Model
Running on Zero

1

1

Audio Difficulty Estimator

🎹

Estimate piano difficulty from audio

Upvote

Collection guide
Browse collections

Whisper vs Distil-Whisper

Seamless M4T

MusicGen

Audioldm Text To Audio Generation

AudioLDM2 Text2Audio Text2Music Generation

AudioSep

Lp Music Caps

Tortoise Tts

All In One

XTTS

Coqui Bark Voice Cloning

VALL E X

WavJourney

Music To Image

MMS

ElevenLabs TTS

AudioGPT

Bark

SpeechT5 Speech Recognition Demo

CoquiTTS (Official)

Whisper

Moe TTS

YourTTS

Talking Face Generation with Multilingual TTS

OpenAI TTS New

Mustango

OWSM Demo

StyleTTS 2

HierSpeech++ (Zero-shot TTS)

Video2music

Whisper Large V2

Musicgen Prompt Upsampling

Qwen-Audio

Seamless M4T v2

Seamless Streaming

Matcha TTS

MusicGen Streaming

Resemble Enhance

Singing Voice Conversion

NaturalSpeech2

Create Your Own TTS Dataset

Podcast Transcription

OpenVoice

M2UGen Demo

Pheme

ESPnet2 TTS

Whisper-WebUI

Image2SFX Comparison

WhisperSpeech

MetaVoice 1B

TTS Arena V2

Whisper Speech X DreamTalk

Canary 1b

MeloTTS

Audio Editing

ChatMusician

xVASynth TTS

NaturalSpeech3 FACodec

Hey Gemma

Ratchet + Whisper

AutoSubs

VoiceCraft

TangoFlux

Parler-TTS

Sing an idea ➡️ Music

Musicgen Songstarter Demo

Whisper JAX

AudioLCM

Stable Audio Live Multiplayer

Stable Audio Open Zero

Make An Audio 3

Mars5 Space

Tango Music AF

BigVGAN

SenseVoice

CosyVoice 300M

PicoAudio

Audio Flamingo Demo

MusiConGen