Spaces for Audio / Voices

John6666 's Collections

Gradio Components

Spaces for MCP

Papers

Spaces for Games / Entertainments

Spaces for Tagger / Captioner / Prompter

Spaces for Text-to-images (SDXL, Pony, SD1.5, Flux,...)

Spaces for Audio / Voices

Spaces for Generative-AI Chats

Resources for Tagging / Captioning / Prompting / LLM

My Bookmarks

Spaces for Image Upscaler / Upsampler / Resizer

LoRAs / Models (SDXL1.0, Pony, SD1.5, Flux, ...)

Spaces for Model / Space / useful Utilities in Hugging Face

Resources for Sound Processing

Spaces for LLM / VLM / NLP

Spaces for Image-to-Image / Video

日本語スペース (Spaces in Japanese language)

Gradio Themes

updated about 8 hours ago

Upvote

Running on Zero

425

425

AICoverGen

🚀

Install and run a GPU-accelerated web UI
Build error

42

42

SBV2 Chupa Demo

👅

Generate chupa sound effects from text
Running

4

4

VisualNovel_sbv_demo

😊

Generate voice from text with style
Running on CPU Upgrade

647

647

Moe TTS

😊

Generate and convert speech using text and audio inputs
Running

6

6

Bert-VITS2 AI Abe&Suga&Kishida

🏺

Generate speech from text
Running

48

48

AICoverGen

🚀

Launch a web interface for model interaction
Paused

12

12

rvc-Blue-archives-hoyogames

:
Running

53

53

VTuber RVC Models

▶

Convert audio to different voices
Running

410

410

RVC Inference HF

👀

Combine and process audio files
Running on Zero

301

301

Audio🔹Separator

🏃

Vocal and background audio separator
Running

55

55

BlueArchiveTTS

📉

Generate audio from text using a voice synthesis model
Runtime error

151

151

Multi Voice TTS(English/Chinese/Japanese)

😆

[中文/English/日本語]multilingual text-to-speech
Build error

441

441

Stable Audio Open Zero

🔥

Generate audio from text prompts
Running

179

179

Applio

🍏

A simple, high-quality voice conversion tool
Runtime error

2.32k

2.32k

Voice Clone

🗣

Clone voices using text and audio samples
Running on Zero

195

195

RVC⚡ZERO

⚡

Voice conversion framework based on VITS
Runtime error

1

1

DiffSinger🎶 Diffusion for Singing Voice Synthesis

🎶
Running

145

145

Ultimate Vocal Remover WebUI

🎵

Run a web interface for text generation
Running

253

253

Aesthetic RVC Inference HF

🍏

Install and run Applio audio processing app
Running

80

80

Advanced RVC Inference

⚡

Download and run voice conversion model
Runtime error

804

804

Vits Models

🏃

Generate audio from text using voice synthesis
Running

561

561

Multilingual Anime TTS

🎙

Generate anime character voice from text
Running

33

33

LoveLive-ShojoKageki VITS

⚡

Generate audio from text using selected speaker and language
Running

371

371

vits-uma-genshin-honkai

🐨

Generate audio from text using VITS
Running

3

3

おしゃべり晋さんメーカー（Style-Bert-VITS2）

🏺

Generate Japanese speech from text
Running

19

19

Hololive Style-Bert-VITS2

😊

Generate speech from text using various voice models
Build error

536

536

Midi Music Generator

🎼

Generate MIDI music from prompts
Running

25

25

Japanese Lyric Generator

🎼

Generate Japanese lyrics
Running on L4

366

366

VALL E X

🎙

Generate audio from text using voice prompts
Running

2

2

AI晋さんメーカー

🔥

Generate Japanese voice from text
Build error

9

9

BangDream-ShojoKageki Bert VITS2

📉

Generate Japanese audio from text
Running

5

5

lovelive-ShojoKageki VITS JPZH

📈

Convert text to speech using multiple school voice models
Running

18

18

Lovelive-nijigasaki-MB-iSTFT-VITS-ZH&JP

🌖

Generate audio from text with ChatGPT integration
Build error

2.38k

2.38k

Bark

🐶

Generate realistic audio from text
Running

1.08k

1.08k

OpenVoice

🤗
Running

319

319

OpenVoiceV2

🤗

Clone a voice to read given text
Runtime error

61

61

ChatTTS OpenVoice

🐠
Running on T4

200

200

MassivelyMultilingualTTS

🌍

Generate speech from text in multiple languages
Runtime error

2.77k

2.77k

XTTS

🐸

Generate speech from text using a reference voice
Runtime error

5.06k

5.06k

MusicGen

🎵

Generate music from text descriptions and optional melodies
Runtime error

516

516

Seamless M4T v2

📞
Sleeping

60

60

Mars5 Space

📉
Build error

19

19

FAcodecV2

🎙

Convert or reconstruct audio using voice samples
Paused

255

255

TTS x Hallo Talking Portrait

👋

Generate Talking avatars from Text-to-Speech
Running on CPU Upgrade

424

424

RVC Genshin Impact

🎤

Convert and modify audio voices
Running

131

131

FoleyCrafter

📚

Generate audio for silent videos
Runtime error

259

259

Voice Clone Multilingual

🏃

Languages ru,en,zh-cn,ja,de,fr,it,pt,pl,tr,ko,nl,cs,ar,es,hu
Running

14

14

Talkalkai Cover

🐨

Execute dynamic code
Running on Zero

MCP

547

547

Image to Music v2

🎺

Get a music sample inspired by the mood of an image
Running

213

213

Whisper Timestamped

🕒

In-browser speech recognition w/ word-level timestamps
Running on CPU Upgrade

845

845

TTS Arena V2

🏆

Vote on the latest TTS models!
Runtime error

24

24

TTSDS Benchmark and Leaderboard

🥇

Text-To-Speech (TTS) Evaluation using objective metrics.
Running

6

6

LAKH MIDI Dataset Search

🐨

Search and explore LAKH MIDI dataset with MidiCaps
Running on Zero

29

29

PicoAudio

📈

Generate audio from text descriptions with timestamps
Running

22

22

Advanced MIDI Search

🏆

Search and explore 179k+ MIDI titles
Runtime error

89

89

SenseVoice

🐠

Transcribe audio with emotions and events
Running

299

299

Whisper Speaker Diarization

🗣

Separate speakers in audio recordings
Build error

272

272

Faster Whisper Webui

🚀

Transcribe audio to text with speaker diarization
Running on Zero

59

59

Vocal Separation SOTA

🎤

Separate vocals from background in audio
Runtime error

99

99

BangDream-ShojoKageki Bert VITS2

🐠

Print "hello"
Runtime error

2

2

BangDream-ShojoKageki Api

🐠

Convert text to speech using band character voices
Running

19

19

BangDream-ShojoKageki Bert VITS2

🐠

Generate audio from text with speaker selection and language translation
Sleeping

13

13

Efficient Audio Captioning

🔊
Configuration error

180

180

NaturalSpeech3 FACodec

🏃

Convert and reconstruct speech files
Running

408

408

tts Text To Speech

🌍

Text-to-speech (TTS) with Next-gen Kaldi
Sleeping

4

4

Edge Tts

🌍
Running

14

14

JA TTS Arena

🏆

Vote on the top Japanese TTS models!
Runtime error

18

18

MIKU TTS

⚡

Convert text to voice using a musical model
Running

20

20

Genshin Music Generator

🎮

Genshin Impact game style music generation
Sleeping

4

4

Advanced RVC Inference

⚡
Sleeping

Style Bert VITS2 MT

🐠
Paused

3

3

ZeroRVC

🎙
Build error

13

13

Edge TTS w/ More Options

👁

Generate speech from text using various voices
Runtime error

33

33

EZ Voice Clone

⚡
Running

4

4

Training Helper Rvc

⚡

easy training helper For RVC
Runtime error

23

23

Anitalker

🚀

Generate talking face video from image and audio
Running

7

7

rvc-Blue-archives

:

Convert and manipulate audio voices
Runtime error

76

76

Fish Diffusion (HiFiSinger) Demo

🌊
Running

18

18

Japanese Ero Voice Classifier

🥰

Classify audio into NSFW categories
Running

31

31

Style Bert VITS2 Editor Demo

😊

Generate voice with Style-Bert-VITS2
Running on L4

627

627

OpenAudio S1

🏆

Generate speech from text
Running

1

1

Rvc Demo

⚡

A demo of RVC pip
Runtime error

107

107

Bark Voice Cloning

🐶

Clone voices from audio files
Build error

1

1

NeonAI Coqui AI TTS Plugin

🐸
Running

106

106

NeonAI Coqui AI TTS Plugin

🐸

Generate speech from text in multiple languages
Runtime error

12

12

AICoverGen

🔥
Running

12

12

Harmonic Melody MIDI Mixer

🔥

Harmonize and mix any MIDI melody
Running

33

33

Ilaria Audio Analyzer

🎵

Create a spectrogram and get audio info
Running

836

836

Ilaria RVC

😻

Generate and modify audio with models
Running

4

4

MDX UVR

🚀

Separe vocal and instrumental tracks from audio
Build error

182

182

GPT SoVITS V2 Pro Plus

🤗

Generate speech from text using reference audio
Running

7

7

Read My Pdf Outloud

🗣

Generate audio from text or PDF
Running

7

7

Vocal Remover

⚡

Remove vocals from your music tracks easily
Build error

827

827

Parler-TTS

🥖

High-fidelity Text-To-Speech
Runtime error

3

3

Japanese Ero Voice Classifier

🥰
Running

8

8

GPT-SoVITS-ToneControl_test

🐠

Generate Japanese audio from text
Running

29

29

Umamusume Bert Vits2

📊

Generate audio from text for anime characters
Running

1

1

Animalese Py

📈

Generate Animalese audio from text
Running

3

3

Animalese RVC

🔶

Convert text to Animalese using sound models
Build error

4

4

AI Hanser

📊
Build error

159

159

Stable Audio Live Multiplayer

💻

Generate audio from text prompts
Running

855

855

Edge TTS Text To Speech

👁

Generate speech from text using Microsoft Edge TTS
Running

21

21

Youtube AI Summarizer

🐨

Transcribe and summarize YouTube videos or audio files
Running

5

5

AICoverGen

🚀

Launch a web interface for downloading and managing YouTube videos
Running

1

1

Animalese Js

💻

Convert text to animal-like speech
Paused

1

1

ASR Model Comparison

💬
Sleeping

4

4

AICoverGenMod

🔥

Start web UI for image generation
Running

1

1

Ilaria Converter

🔨

Convert audio and images to different formats
Running

1

1

RVC UI TES

👁

Convert and train voice models
Build error

8

8

RVC Genshin Impact

🎤
Sleeping

1

1

Voice2VoiceChatbot

🦀
Sleeping

RealTimeVoicetoVoiceChatbot

🌖
sp-uhh/speech-enhancement-sgmse

Audio-to-Audio • Updated Feb 2 • 28 • 12
Running

2

2

RVC UI

🏃

An easy-to-use voice conversion framework based on VITS.
Runtime error

RVC

🏃
Runtime error

AI Voice Assistance

🌍
Running on Zero

4

4

Voice Clone

🗣

Clone voices by typing text and providing a reference audio file
Running

6

6

Optimus

🌍

Generate speech and translate audio using AI models
Running

41

41

Doc To Dialogue

👀

Transform a report or document into an interview/discussion
Running

55

55

Voicee

⚡

Super fastest Voice Assistant
Running

6

6

Fish Audio API Demo

🐟

Convert text to speech
Running on Zero

73

73

Musicgen Songstarter Demo

👁

Generate music using descriptions and optional melody audio
Running

87

87

Hololive Rvc Models V2

▶

Generate audio with voice conversion
Running

38

38

Advanced MIDI Renderer

🎹

Transform and render any MIDI
Sleeping

3

3

Imagen POP Music Medley Diffusion Transformer

🚀

Generate POP music medley with Imagen diffusion transformer
Sleeping

2

2

Ultimate MIDI Classifier

🔥

Classify absolutely any MIDI by genre, song and artist
Running on Zero

5

5

Intelligent MIDI Comparator

📚

Intelligently compare any pair of MIDIs
Running

112

112

ChatTTS Speaker

🌍

Explore and download stable speaker embeddings for ChatTTS
Sleeping

2

2

Bridge Music Transformer

🌖

Generate a seamless bridge between two composition parts
Build error

63

63

vits-simple-api

👀

Generate audio from text or voice input
Running

16

16

Bert VITS Umamusume Genshin HonkaiSR

🎙

Generate speech from text with customizable parameters
Running on Zero

67

67

Audio SR

🔊

Fixed fork of the original audio sr!
Running on Zero

364

364

Seed Voice Conversion

🎤

Convert voice to match another's style or tone
Running

40

40

Mini Omni

⚡

Generate audio responses from uploaded or recorded audio
Running

6

6

Monophonic MIDI Melody Harmonizer

⚡

Retrieval augmented harmonization of any MIDI melody
Running

12

12

MIDI Melody

⚡

Add a unique melody to any MIDI file
Running

3

3

MIDI Chords Mixer

🔥

Mix chords from one MIDI to another MIDI
Running

2

2

Morse To Audio

🏆

Convert Morse code to audio
Runtime error

1

1

RCV EASY GUI

🚀
Running

1

1

Advanced RVC Inference

⚡

Convert and modify voices in audio files
Runtime error

3

3

Lyricsgenius

⚡

Get Lyrics from Genius's Link
Build error

1

1

Groq Gradio Voice Assistant

👁
Sleeping

2

2

Hex Separator

🐠
Running

3

3

Groq API Models

🐠

Groq API Playground
Paused

2

2

AI Tube Engine MusicGen

🎵
Paused

1

1

AI Tube Engine MusicGen

🎵
Paused

1

1

AI Tube Engine MusicGen

🎵
Paused

5

5

AI Tube Engine MusicGen

🎵
Runtime error

12

12

UTMOSv2

🌖

Generate speech quality score from audio
Build error

5

5

Mini Omni

⚡
Running

12

12

Bench.audio

📊

LMSYS bench for audio agents
Runtime error

78

78

Compressed Wav2Lip

🌟
Running

130

130

Gradio Lipsync Wav2lip

👄

Generate lip-synced video from image or video and audio
Runtime error

8

8

EchoMimic

🐨

Create lifelike animated videos using a photo and audio
Running

55

55

Wav2lip Gpu

🌍

Create a video by syncing spoken audio to an image
Running

1

1

Matcha TTS Japanese

🏃

Description of Matcha TTS Japanese
Running

135

135

DeepFilterNet2

💩

Generate clean audio from noisy recordings
Running on Zero

17

17

French Parler-TTS

🇫

High-fidelity Text-To-Speech
Running on Zero

272

272

EzAudio

🟣

Generate and edit audio from text prompts
Running on Zero

21

21

Kotoba Whisper Demo

🔥

Transcribe audio to text with timestamps
Running

1

1

Matcha Tts Onnx Benchmarks

🦀

Benchmark load model and tts time
Runtime error

7

7

Mini Omni

⚡
Sleeping

2

2

AIChat-matcha-tts-onnx-en

🐠

Give your space a voice! (Demo)
Runtime error

16

16

GAMA

🌍

Answer questions about audio
Running on Zero

5

5

GAMA-IT

🏆

Analyze audio and answer questions about it
Runtime error

1

1

Sbv2 Py

🦀
Build error

214

214

OpenMusic

🎶

Generate music from text descriptions
Running

3

3

Mistral 7B Instruct v0.3 Matcha-TTS English

🐠

Enjoy TTS Chat
Paused

2

2

Moshi

💨

Create interactive spoken dialogue using audio input
Running on Zero

51

51

EzAudio ControlNet

🟣

Generate audio from text and reference audio
Runtime error

3

3

Fish Audio API Demo

🐟
Runtime error

1

1

Whisper En Tiny

🐠
Sleeping

7

7

Guided Rock Music Transformer

🏃

Controlled source augmented rock music transformer
Running on Zero

21

21

Long-form MusicGen

🎷

Long-form Musicgen
Running

131

131

Multilingual TTS

💻

Convert text to speech in multiple languages
Running

3

3

AI岸田文雄メーカー

🔥

Generate realistic-sounding AI voice from text
Running

1

1

AI菅義偉メーカー

🔥

Generate菅義偉-like speech from text
Running

1

1

Audio Mouth

😻

Generate lip-synced talking head video from audio
Running

450

450

PDF2Audio

📚

Transform any text into detailed narratives, summaries, or podcast scripts
Running on CPU Upgrade

1.04k

1.04k

Open ASR Leaderboard

🏆

View and request speech recognition model benchmarks
Runtime error

1.09k

1.09k

Open NotebookLM

🎙

Personalised Podcasts For All - Available in 13 Languages
Running on Zero

4

4

Kotoba Whisper Bilingual Demo

🔥

Transcribe and translate Japanese & English audio
Runtime error

468

468

MeloTTS

🗣

Fast, efficient, & multilingual text-to-speech
Runtime error

197

197

Canary 1b

🐤

Transcribe and translate audio into text
Running

1

1

Style Bert VITS2 SW

😻

Generate audio from text
Runtime error

21

21

Llama 3.2 3b Voice

👁
Build error

1

1

Pdf2audio

📚
Build error

962

962

Whisper Turbo

🤯

Transcribe audio or YouTube videos into text
Running on Zero

333

333

Realtime Whisper Turbo

🤯

Realtime implementation of Whisper large turbo
Running

161

161

Whisper Large V3 Turbo WebGPU

🚀

ML-powered speech recognition directly in your browser
Runtime error

310

310

Tortoise Tts

🐢

ExpressivText-to-Speech
Runtime error

43

43

Russian Text To Speech

💻

Generate speech from text with accentuation
Running

6

6

Yt-dlp Wav

📉

Download video or audio from URL
Running on T4

337

337

UnlimitedMusicGen

🎼

unlimited Audio generation with a few added features
Runtime error

87

87

AudioCraft Plus v2.0.0a (MusicGen + AudioGen)

🎶
Runtime error

21

21

MusicGen+ V1.2.7 (HuggingFace Version)

🎼
Configuration error

61

61

VoiceRestore

🔊

Restore degraded audio using a Transformer-based model
Runtime error

3

3

Whisperturbo

⚡

whisper3 turbo
Running

62

62

GPT-SoVITS-3s-cloning-free-TTS

🎙

Generate audio from text using selected character voices
Running

4

4

おしゃべり石破茂メーカー（Style-Bert-VITS2）

🏺

Generate audio from text using a customizable voice model
Running

1

1

おしゃべり二階俊博メーカー

🏺
Runtime error

3

3

Text To Meow

🐠
Running

4

4

Rvc Ui

🔥

Transform audio with pre-trained models and customize settings
Running

28

28

Reverb ASR Demo

🌍

Transcribe audio to text with style options
Running

2

2

Ilaria RVC Mod

😻

Separate vocals and instruments from audio
Running on T4

394

394

Resemble Enhance

🚀

Enhance and clean audio files
Runtime error

6

6

Openai Whisper Large V3 Turbo

💻

Transcribe audio to text
Running

58

58

RVC PlayGround

💻

Convert audio voices to match a chosen model
Running

68

68

Podcastfy.ai - An Open Source alternative to NotebookLM's podcast feature

🚀

Generate a podcast from text, URLs, PDFs, and images
Running on Zero

77

77

Video to Music

🎞

Generate and apply matching music background to video shot
Running

201

201

Video SoundFX

👂

Generates a sound effect that matches video shot
Running

MCP

173

173

Image2SFX Comparison

👂

Generates audio environment from an image
Running on Zero

2.57k

2.57k

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Sleeping

1

1

Heartbeat

💜
Running

422

422

TTS Spaces Arena

🤗

Blind vote on HF TTS models!
Running on CPU Upgrade

73

73

xVASynth TTS

🧝

CPU powered, low RTF, emotional, multilingual TTS
Running

379

379

— AI Jukebox —

🎶

Generate music powered by AI
Sleeping

346

346

TANGO

🐠

Co-Speech Gesture Video Generation
Runtime error

17

17

Anime Whisper Demo

🥰

Transcribe Japanese audio to text
Running on Zero

64

64

Ichigo Llama3.1 S Instruct

🏢

Generate text from audio recordings
Running

10

10

Whisper Japanese Phone Demo

🚀

Whisper model to transcript japanese audio to katakana.
Running on Zero

266

266

ClearerVoice-Studio (Speech Enhancement, Separation and Extraction)

📈

Better AI powered platform to purify your speech signal
Running

21

21

Steganography

♫

Text | Image | Audio | Video to Spectrogram || Steganography
Running

18

18

AICoverGenMod

🔥

Generate Cover From AI Voice Model
Running

28

28

UVR5 UI

🚀

Separate audio into stems using various models
Sleeping

19

19

Diva Realtime Chat

🗣

Generate text responses from audio input
Running on Zero

5

5

Kotoba Whisper Diarization Demo

👁

Transcribe and diarize your audio recordings
Configuration error

13

13

Synthio Stable Audio Open

📚

Stable audio open model from Synthio paper.
Sleeping

1

1

RYO EVC

🚀
Runtime error

1

1

UVR

😻
Running on Zero

35

35

Moonshine ASR

🌒

Fast & efficient ASR outperforming Whisper!
Running

31

31

seewav-gui

🔊

Generate a video from audio with customizable waveform visualization
Runtime error

74

74

RWKV Music

🎵

Generate MIDI music using RWKV v4!
Build error

5

5

MP3 Transcribe

💻

Whisper Transcribe MP3 files, use a GPU to convert faster!
Runtime error

6

6

StyleTTS 2 Zero

🗣

Efficient, fast, and natural text to speech with StyleTTS 2!
Configuration error

260

260

MaskGCT TTS Demo

😻

MaskGCT TTS Demo
Running on Zero

111

111

MelodyFlow

🎵

Generate music from text and melody
Running on Zero

731

731

Whisper Large V3

🤫

Transcribe audio and YouTube videos to text
Running

6

6

Ultimate Chords Progressions Transformer

🚀

Self-correcting multi-instrumental chords transformer
Runtime error

8

8

Chords Progressions Transformer

🎶

Chords-conditioned music transformer
Running on Zero

46

46

Fast Whisper Turbo

⚡

Ultra-fast Whisper Turbo inference ⚡
Running on A10G

306

306

AudioLDM2 Text2Audio Text2Music Generation

🔊

Generate audio and waveform video from text
Running

7

7

Hey Buddy!

🗣

In-Browser Audio Wake-Word Spotting
Sleeping

3

3

Streamlit Pianoroll

🎹

Streamlit pianoroll playback element
Running

32

32

Audio-Separator (UVR)

⚡

Audio-Separator by Politrees
Running on Zero

101

101

Giant Music Transformer

🦖

Fast multi-instrumental music transformer
Runtime error

23

23

Omni Mini (WebRTC)

🌖
Sleeping

5

5

Fortepyan Datasets

🎹

Streamlit browser for piano music datasets.
Running

4

4

PIANO Dataset

🎹

Demo of masking tasks from the PIANO dataset
Running on L40S

146

146

Fish Agent

💬

An end-to-end (e2e) Voice Language Model by Fish Audio.
Running

14

14

Audio to Stems to MIDI Converter

🎵

Separate audio stems and convert to MIDI
Running

29

29

Podcast Generation

🌍

Generate podcasts with AI avatars
Sleeping

ChatTTS OpenVoice

🐠
Sleeping

1

1

OpenVoice

📚

Create personalized voice clips with情感
Runtime error

13

13

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Running

334

334

Bark with Voice Cloning

📊
Runtime error

12

12

Midi Music Generator

🎼

Generate MIDI music sequences
Sleeping

4

4

Audio Lyrics Extractor

🎵
Running

10

10

Did StyleTTS 2 Generate It?

🤔

Did StyleTTS 2 generate that audio?!?
Paused

35

35

Hertz Dev

🌍

base model for mono-channel completion
Running

21

21

Xtts

⚡

Generate audio from text with custom speakers
Build error

303

303

ChatTTS Forge

💬

Launch a web interface for text-to-speech and SSML processing
Running on Zero

2.88k

2.88k

Kokoro TTS

❤

Upgraded to v1.0!
Running

6

6

Pipertts

🌖

Generate voice audio from text input
Running

64

64

Nexa Omni Demo

🎧

Generate text from audio input
Runtime error

21

21

Video2music

📚

Generate music for a video based on its content and key
Runtime error

813

813

Audioldm Text To Audio Generation

🔊

Generate audio from text descriptions
Runtime error

2

2

So VITS SVC

🦀

Generate Voice Clones
Runtime error

2

2

GPT SoVITS

👀
Running on Zero

602

602

Spanish F5

🗣

Spanish finetune for the original F5 model.
Running

2

2

Dolce SVC

🎤
Configuration error

3

3

DolceTTS

🚀

Generate speech from text
Running

3

3

Lipsync

⚡

Convert audio to lip-sync data
Running

6

6

Chino TTS

☕
Running

2

2

Style Bert VITS2 NO

🐨

Generate speech from text in multiple languages
Running

1

1

Style Bert VITS2 SU

📉

シャルティアのAI音声合成モデルを作りました。
Sleeping

1

1

Style Bert VITS2 MHY

🔥

早乙女乱馬（女）のAI音声合成モデルを作りました。
Sleeping

1

1

Style Bert VITS2 SAR

🚀

ベアトリスのAI音声合成モデルを作りました。
Paused

38

38

Talk To Ultravox

⚡

Talk to Fixie.ai's Ultravox with WebRTC ⚡️
Sleeping

3

3

SoundOfWater

🏃

Estimate physical properties merely from pouring sound!
Running

9

9

Llama Code Editor

🐢

Create interactive HTML web pages with your voice
Running on CPU Upgrade

156

156

sutra-avatar-v2

🐨

Generate animated avatars from images or videos with audio
Sleeping

1

1

Transcribe & Translate

🌍

Record an audio, then use AI to transcribe and translate it.
Running on Zero

17

17

Inpaint Music Transformer

🖌

Large and fast music transformer for pitches inpainting
Running

38

38

Tsukasa 司 Speech

🌖

Frontier Japanese Speech Generation Network
Running

9

9

MusicGen Continuation

🎵

Generate music based on text and melody
Running

5

5

Semanticodec Ultra Low Bitrate Audio Codec

🚀

Ultra-low bitrate neural audio codec (0.31~1.40 kbps) with a
Running

25

25

Audiosr Versatile Audio Super Resolution

📚

Versatile audio super resolution (any -> 48kHz) with AudioSR
Paused

2

2

OuteTTS 0.2 500M Demo GPU

🐠

Generate human-like speech from text
Sleeping

2

2

ChatTTS Forge English interface

💬

TTS tool
Sleeping

1

1

Style Bert VITS2 RU2

📚

short_description: 猫屋敷まゆのAI音声合成モデルを作りました。
Running

17

17

Galgame Voice Finder

🥰

Search for similar game voice samples
Sleeping

1

1

Vad Go

👁
Build error

184

184

Indic Parler-TTS

👀

A demo of Indic Parler-TTS
Sleeping

1

1

Voice Activity Detection

🐳
Running

7

7

Vikhr 4o

👀

Transform text to speech and speech to text
Running

21

21

Wespeaker Demo

🏢

Verify speakers using voice samples
Sleeping

4

4

Wesep Tse 2speaker Demo

💻

Target Speaker Extraction with WeSep
Running

14

14

Wenet Demo

🐢

Transcribe speech into text
Running

7

7

Open_ASR_Leaderboard

🏆

View, filter, and request model performance metrics
Running

41

41

Text-to-Speech WebGPU

🗣

WebGPU text-to-Speech powered by OuteTTS and Transformers.js
Running

22

22

SpeechScore (Speech Quality Metrics and Evaluation)

📈

A home for scoring speech quality
Running

2

2

Fish Speech Benchmark

🐠

Non official benchmark by Fish Speech
Running on Zero

13

13

Chupa Generator

👅

Generate chupa sounds from text or audio
Running on Zero

9

9

Japanese Parler-TTS Mini Demo

🌖

Generate Japanese speech from text
Running on Zero

6

6

Japanese Parler-TTS Large Demo

🏢
Runtime error

3

3

Make Anime Emotion Dataset

⚡
Running

6

6

Anime Speech Emotion Recognition

😊

Detect emotions from an audio file
Build error

845

845

MMAudio — generating synchronized audio from video/text

🔊

Generate audio from video or text prompts
Runtime error

28

28

Voice Clone

🗣

Clone a voice with text input
Build error

163

163

Sound AI SFX

🐠

SText to Audio(Sound SFX) Generator
Running

7

7

Talk To Moshi

👁

Talk to Kyutai's moshi - powered by Gradio WebRTC!
Running on T4

402

402

HierSpeech++ (Zero-shot TTS)

⚡

Generate high-quality speech from text using a prompt audio
Runtime error

11

11

Talk To Gradio Docs Rag

🌍

Talk to the Gradio docs! Powered by Pydantic and WebRTC ⚡️
Running

5

5

Melody Workshop

📊

"One-minute creation by AI Coding Autonomous Agent MOUSE-I"
Running on Zero

18

18

Text2midi

📉

Generate music from text prompts
Running

44

44

Website Seo Checker

🔊

Analyze SEO of a website
Running

2

2

CC Audio 8

🐢

Classify audio sounds into categories
Sleeping

2

2

Lotus

🪷
Running

130

130

Moonshine Web

🌙

Real-time in-browser speech recognition
Running

11

11

Openai Realtime Voice

💻

Talk with openAI's new Realtime Voice API
Running on Zero

20

20

SoloAudio

🎯

Separate sounds from audio mixtures using text prompts
Running

32

32

Music Genre Classifier

🎶

Music Genre Classifier
Running

12

12

Guzheng Playing Tech

☰

Guzheng Performance Technique Recognizer
Running

12

12

Chinese Instruments

🪕

Chinese Traditional Instrument Sound Retriever
Running

12

12

Pentatonic Mode

🪕

Chinese Music Pentatonic Mode Detector
Running

3

3

Audio Edit

🐨

Convert audio to image spectrograms
Paused

4

4

MMAudio

🔊

Video to Audio
Running

42

42

Audio Transcription

🎙

Transcribe audio to text from URLs or uploads
Running

5

5

Audio 8D

📉

Make your audio to 8D
Running

22

22

Audio Separator

⚡

Python Audio Separator Demo
Running

2

2

Real-time Whisper WebGPU (Vue)

🎤

Yet another Real-time Whisper with WebGPU, written in Vue
Sleeping

6

6

MIDI Identification

🦀

Identify any MIDI
Running

4

4

Moonshine Web (Vue)

🌙

Yet another Real-time in-browser STT, re-implemented in Vue
Running

22

22

AIRI: Virtual Companion

🧸

AI driven VTuber & Companion, supports Live2D and VRM.
Running

12

12

Figured Bass Calculator

🎸

Convert figured bass to chord
Running

216

216

Ebook2audiobook v25.8.18

🚀

Turn any ebook into audiobook, 1107+ languages supported!
Running

3

3

Ebook2audiobook_v1.0

🐸

V1.0Convert any Ebook to AudioBook with Xtts + VoiceCloning!
Running

14

14

Ebook2audiobookPiper-tts

🪈

Converts Ebooks into audiobooks with piper-tts
Runtime error

14

14

Ebook2AudiobookV25.3.2_Docker_Test

⚡

Ebook2audiobook docker space beta
Running

15

15

Music Vision

🎵

Audio visualization circle effect tool
Running

8

8

MS1-X Virtual Synth

📟

Ready-to-play synth instrument!
Running

13

13

hoyoTTS

🔊

Genshin Impact & Honkai Star Rail game character voice TTS
Running

12

12

Erhu Playing Tech

🪕

Erhu Performance Technique Recognizer
Running

12

12

Bel Canto Discriminator

🎙

Discriminator of Bel Canto and Chinese Folk Singing
Running

16

16

Pianos

🎹

Piano Sound Quality Classifier
Running

17

17

Chest Falsetto Discriminator

🎤

Discriminator of Chest Vocie and Falsetto
Running

6

6

Monster Piano Transformer

👾

Ultra-fast and very well fitted solo Piano music transformer
Running

2

2

Style Bert VITS2 IM2

🌖

ヘスティアのAI音声合成モデルを作りました。
Running

1

1

Style Bert VITS2 YHK2

🏃

フレイヤのAI音声合成モデルを作りました。
Running

2

2

Anachrovox V0.1 Emerald (Bugged)

📻

Hands-Free AI Voice Chat with a Retro Vibe
Running

3

3

Anachrovox V0.1 Azure (Bugged)

📻

Hands-Free AI Voice Chat with a Retro Vibe
Running

2

2

Anachrovox V0.1 Amber (Bugged)

📻

Hands-Free AI Voice Chat with a Retro Vibe
Running

67

67

MIDI-Melody-Generator - One-minute creation by AI Coding Autonomous Agent

📉

https://huggingface.co/spaces/VIDraft/mouse-webgen
Runtime error

24

24

Audio Separator

📊

Separate music and vocals from audio
Running

38

38

Open Universal Arabic Asr Leaderboard

🥇

A benchmark for open-source multi-dialect Arabic ASR models
Build error

273

273

MusicGen Streaming

🔥

Generate music from text prompts
Running

2.75k

2.75k

Whisper JAX

⚡
Running on Zero

31

31

Parler-TTS Streaming

📝

High-fidelity Text-To-Speech
Running on Zero

MCP

499

499

LatentSync

👄

Audio Conditioned LipSync with Latent Diffusion Models
Runtime error

261

261

Singing Voice Conversion

🎼

Transform your voice into a singer's
Running

59

59

Text To Speech

🔥

Generate speech from text with different speakers
Running

3

3

Felguk Audio Edit

🦀

Audio edit
Runtime error

309

309

Kokoro TTS Zero

🎴

✨[With v1.0.0] Accelerated TTS on Kokoro-82M
Running

5

5

📚 𝕡𝕕𝕗 𝕥𝕠 𝕊𝕡𝕖𝕖𝕔𝕙 ℂ𝕠𝕟𝕧𝕖𝕣𝕥𝕖𝕣 🎧

📚

📚PDF 🪄Text to 🗣️Speech 🤖Transformer
Running on L4

1.37k

1.37k

SadTalker

😭

Generate a talking face video from an image and audio
Runtime error

2

2

OLLAMA TTS CLIENT

😎

Communicate with an AI assistant and convert text to speech
Running

11

11

Piper TTS Spanish

🚀

Convertir texto a audio
Running

22

22

Audio Visualizer - One-minute creation by AI Coding Autonomous Agent

🦀

https://huggingface.co/spaces/VIDraft/mouse-webgen
Sleeping

1

1

JARVIS2

🦀

2
Running on Zero

321

321

TangoFlux

🚀

Text to Audio (Sound SFX) Generator
Running

276

276

Rvc Models

🎤

Convert or generate voice audio
Running

8

8

Karaoke MIDI Search

🎼

Search and play Karaoke MIDI by title, lyrics, or summary
Running

20

20

Semantic Audio Search w/ Transformers.js

🎵

Search music using keywords
Running on Zero

40

40

Misaki G2P

⚡

G2P
Running on Zero

8

8

ClearerVoice-Studio (Speech Super Resolution)

📈

Better AI powered platform to purify your speech signal
Running

1

1

Style Bert VITS2 NHR

🏃

結束いのりのAI音声合成モデルを作りました。
Running

1

1

Style-Bert-VITS2-AJU YM

🌖

ドラクエ３の女勇者のAI音声合成モデルを作りました。
Running

1

1

Style Bert VITS2 AKT

⚡

喜屋武飛夏のAI音声合成モデルを作りました。
Running

19

19

3DAudio-Spectrum-Analyzer - One-minute creation by AI Coding Autonomous Agent

📉

https://huggingface.co/spaces/VIDraft/mouse-webgen
Running

2

2

Badassgi

🤯

Korean Speech Transcribe(Text) and English Translate(Korean)
Running on Zero

MCP

30

30

Audiocraft

🎷

Demo for Jasco Model Music Stems Generation
Running

207

207

Kokoro Text-to-Speech

🗣

High-quality speech synthesis powered by Kokoro TTS
Sleeping

4

4

AudioTranscribe

⚡

Transcribe and summarise audio files using AI.
Runtime error

3

3

GSV MiSide Japanese

🌖

GPT-SoVITS for MITA!
Running on Zero

4

4

Guided Accompaniment Transformer

🎺

Guided melody accompaniment generation with transformers
Running

9

9

Faster Whisper Webui with translate

✨

Transcribe audio files to text
Running on Zero

306

306

Llasa 3b Tts

🔥

Zero Shot voice cloning with llasa 3b (Unofficial Demo)
Running

29

29

Egyptian Arabic TTS

🐨

A humble space for trying EGTTS V0.1
Paused

201

201

YuE

👩

Generate music from lyrics and genre tags
Running on Zero

53

53

YuE

👩

OpenSource Music Generator
Running on Zero

3

3

Make Custom Voices With KokoroTTS

⚡

Make Custom Voices With KokoroTTS
Running

3

3

MIDI Loops Mixer

🎨

Mix random MIDI loops into one coherent music composition
Running

4

4

Text To Speech Online

👀

Convert text to speech online
Running

22

22

Speech To Text Online

🎤

Convert spoken words to text
Running on Zero

39

39

Llasa 8b Tts

🔥

Zero Shot voice cloning with llasa 3b (Unofficial Demo)
Runtime error

14

14

soundfont-generator

🦦

Generate soundfonts with latent flow matching
Running

3

3

Beepbox

📈

beepbox
Running on Zero

MCP

37

37

Auffusion

😻

Audio Gen, Audio Style Transfer and Audio InPainting
Running on L40S

2

2

Talk To Ultravox

⚡

Talk to Fixie.ai's Ultravox with WebRTC ⚡️
Running

3

3

Kokoro TTS Translate v2.0

📉

This is a text-to-speech and translator app.
Running on Zero

6

6

Llasagna v0.1 1b TTS

🍕

Generate audio from text using a voice sample
Running

321

321

Kokoro Text-to-Speech (WebGPU)

🗣

High-quality speech synthesis powered by Kokoro TTS
Running

2

2

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Running on Zero

MCP

42

42

Hibiki Simple

👄

High-Fidelity Simultaneous Speech-To-Speech Translation
Running on Zero

12

12

Music2emo

📊

Towards Unified Music Emotion Recognition across Dimensional
Runtime error

12

12

Llasa 1b Multilingual TTS

🌍

Generate speech from text with or without cloning a voice
Running on Zero

7

7

Llama Midi

🦀

Write musical scores with LLaMA
Running on Zero

355

355

UVR5 UI

⚡

Separate audio into stems using various models
Running

18

18

Music source separation

🌖

Separate vocals and accompaniment from audio
Running on Zero

405

405

Zonos

🌍

Generate audio from text with customizable emotions and settings
Running

111

111

Make Custom Voices With KokoroTTS

⚡

Make Custom Voices With KokoroTTS
Running

5

5

Zonos

🔊

Speech Synthesis with Zonos
Running

71

71

Kokoro Web

🗣

ML-powered speech synthesis directly in your browser
Running

224

224

AI Podcast Generator

🎙

Generate Podcast using Kokoro-TTS!
Running

9

9

Audio Arena

⚡

audio-arena
Running

11

11

GPT SoVITS V2

😻

Generate realistic voice from text with GPT-SoVITS model
Running on Zero

15

15

Llasa 1B Multi Speakers Genshin Zh En Ja Ko

🚀

Llasa-1B-Multilingual finetuned using simon3000/genshin-voic
Paused

60

60

SoundwaveDemo

📉

Process audio and generate text output based on instructions
Runtime error

4

4

MIDI Templates Inpainter

🖌

Inpaint pitches in MIDI templates to create unique songs
Running

12

12

Guzheng Tech99

☰

Frame-level guzheng playing technique detector
Running

1

1

Ilytka

💻

Generate audio from text
Sleeping

4

4

AI Promo Studio with Llama 3

🎧

Generate creative radio Ads with AI.
Sleeping

1

1

Drum Groove Generator

📈

Generate drum beats from MIDI files
Running

3

3

MIDI Mamba159M HK

😻

Generate music and download as MP3 or MIDI
Running

25

25

Gemini Audi Video Chat

🏃

Have a video chat with Gemini - it can see you ⚡️
Running

2

2

RAD-TTS++ Ukrainian (Vocos)

🎧

Use RAD-TTS++ model to synthesize text in Ukrainian
Running on L40S

184

184

Skyreels A1 Talking Head

😻

Audio to Talking Face
Paused

3

3

Di♪♪Rhythm

🎶

Blazingly Fast and Embarrassingly Simple Song Generation
Runtime error

10

10

DiffRhythm

🎶

Blazingly Fast and Embarrassingly Simple Song Generation
Build error

623

623

Di♪♪Rhythm

🎶

Blazingly Fast and Embarrassingly Simple Song Generation
Running

4

4

DarijaTTS Test

🐢

Generate audio from Darija text
Sleeping

3

3

CC Denoise

🐢

Remove noise from audio files
Build error

227

227

Spark TTS

🌖

A text-to-speech model powered by SparkAudio and Mobvoi.
Sleeping

8

8

SonicOrbit

👁

transforms your audio files into immersive 360° binaural
Runtime error

16

16

Generate Sound Effects From Image

🎶

Turns your image into matching sound effects
Running

2

2

VoiceReplacer

🏢

VoiceReplacer
Running

12

12

Indic Asr

🏆

A speech recognition tool for Indic languages.
Running

8

8

BangDream Bert VITS2

👀

Generate voice from text using BangDream TTS
Running

37

37

Spark-TTS

⚡

(Unofficial) Gradio demo for Spark-TTS
Build error

827

827

Sesame CSM

🌱

Conversational speech generation
Running

4

4

Ilaria RVC

😻

Convert and manipulate audio with models
Running on Zero

230

230

Orpheus TTS

🚀

Try Orpheus TTS here
Build error

38

38

Canary 1B Flash

🐤

Canary 1B Flash demo
Running

341

341

Qwen2.5 Omni 7B Demo

🏆

Generate text and speech from audio, video, and text input
Runtime error

1

1

Style Bert VITS2 TT

📈

オグリキャップのAI音声合成モデルを作りました。
Runtime error

1

1

Style Bert VITS2 TKR

🏆

アマテ・ユズリハ（マチュ）のAI音声合成モデルを作りました。
Running on Zero

MCP

149

149

KDTalker

😛

Generate a talking-head video from an image and audio
Running

61

61

Expressive TTS Arena

🎤

Vote for the best TTS voice based on expressiveness
Build error

89

89

MegaTTS3 Demo

👋
Running

1

1

Speech-to-Text for Ukrainian v2.1 (W2V-BERT 2.0) with LM

🎙

Transcribe Ukrainian audio to text
Running on Zero

2

2

Speech-to-Text for Ukrainian v2.1 (W2V-BERT 2.0)

🎙

Transcribe Ukrainian audio to text
Running on Zero

174

174

IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System

🎙

Generate audio from text using a reference audio sample
Running

2

2

Orpheus FR TTS

🚀

Try Orpheus TTS here
Sleeping

2

2

BERT ISTFT VITS

🐨

TTS语音合成系统
Running on Zero

5

5

MMS TTS

🗣

Demo of Facebook's MMS Text-to-Speech Model
Build error

94

94

Vevo for Zero-shot VC, TTS, and More

🐠

Controllable Zero-Shot Voice Imitation
Running on Zero

1

1

SimpleRVC

🐨

Discover and share AI singing models
Running on Zero

37

37

Morpheus Uncensored Tts

👀

morpheus tts - uncensored
Build error

1.64k

1.64k

Dia 1.6B

👯

Generate realistic dialogue from a script, using Dia!
Sleeping

1

1

Onsei Tukuri

🐨

Generate customized text-to-speech audio
Running

MCP

9

9

Kokoro Text-to-Audio

🎵

Convert text to speech using Kokoro model
Running on Zero

425

425

Parakeet-TDT-0.6b-V2

Transcribe audio to text with timestamps
Running on Zero

42

42

Voila Demo

💻

Chat with a voice-clone AI
Running on Zero

533

533

ACE Step

😻

A Step Towards Music Generation Foundation Model
Running on Zero

140

140

Open NotebookLM

🎙

Generate a podcast to discuss the topic of your choice!
Running on Zero

149

149

FantasyTalking

😻

Generate realistic talking video from an image and audio
Runtime error

82

82

Daily Paper Podcast

🎙

Generates a podcast about today's top trending paper.
Running on Zero

18

18

StyleTTS2 Lite Vi

🦀

Generate audio from text using reference voices
Running on Zero

7

7

StyleTTS2 Lite

🦆

Generate audio from text with customizable voice
Running on Zero

MCP

101

101

TIGER Audio Extractor

✂

Extraction & Reconstruction for Efficient Speech Separation
Running on Zero

38

38

AI Podcast Generator

😻

converts URLs, PDFs, and keywords into professional podcasts
Running

6

6

Multilingual TTS

💻

Generate speech from text in multiple languages
Running

4

4

RAD-TTS++ Ukrainian (HiFiGAN)

🎧

Use RAD-TTS++ model to synthesize text in Ukrainian
Running

6

6

VAD with MarbleNet

🗣

Voice Activity Detection using MarbleNet model
Running on Zero

MCP

1.37k

1.37k

Chatterbox TTS

🍿

Expressive Zeroshot TTS
Running on Zero

38

38

Voice Clone AI Podcast

🍿

Voice Clone AI Podcast Generator with Chatterbox
Running on Zero

107

107

SoloSpeech

🎯

State-of-the-art target speech extractor
Running on Zero

8

8

Voice Trans

🐢

voice-trans
Build error

183

183

Vui

🏢

NotebookLM conversational speech model
Running on Zero

13

13

SonicVerse

🖼

Generate detailed music descriptions from audio clips
Sleeping

395

395

Riffusion • Spectrogram To Music

🌖

Get Music from Generated Spectrogram with Diffusion
Running

1

1

Style Bert VITS2 ATD

💻

クロエ・オベールのAI音声合成モデルを作りました。
Running on Zero

94

94

CapSpeech TTS

🧢

Stylized TTS – design voice, accent, and emotion your way
Runtime error

400

400

Song Generation

🎵

Generate a custom song from lyrics and prompts
Running on L4

38

38

V-JEPA 2 - Streaming Video Classification

🌍

Run V-JEPA 2 on a video stream for Video Classification
Build error

143

143

Voice Clone TTS

🏆

mcp_server
Sleeping

5

5

Music to Outfit

👚

Generate an outfit from audio input
Running on Zero

35

35

MOSS TTSD

📉

MOSS-TTSD: Text to Spoken Dialogue Generation
Sleeping

6

6

Furigana From Speech And Text

🏆

音声と漢字仮名交じりテキストからふりがなを推定するツール
Running on L40S

230

230

Meigen MultiTalk

🎙

Audio-Driven Multi-Person Conversational Video Generation
Running on Zero

13

13

Orpheus Music Transformer

🎺

SOTA 8k music transformer trained on 2.31M+ HQ MIDIs
Sleeping

2

2

Orpheus Drums Transformer

🎺

Inpaint drum tracks with Orpheus Music Transformer
Running on Zero

2

2

Orpheus Humanizing Transformer

🎺

Humanize any music score with Orpheus Music Transformer
Running on Zero

4

4

Orpheus Bridge Music Transformer

🌉

Seamless music bridges generation with transformers
Running on Zero

3

3

Godzilla Piano Chords Texturing Transformer

💻

Solo Piano chords texturing music transformer
Build error

MCP

287

287

ThinkSound

🔊

Generate audio for a video using captions and descriptions
Sleeping

5

5

MIDI Doctor

🩺

MIDI Doctor will see your MIDI now :)
Sleeping

1

1

Fast Urdu ASR

🚈

Fast Urdu speech recognition app using CPU.
Sleeping

4

4

Transcribed Urdu

🎙

The most accurate Urdu speech recognition app.
Running on Zero

3

3

Orpheus MIDI Comparator

📚

Intelligently compare any pair of MIDIs
Running on Zero

3

3

Orpheus MIDI Loops Mixer

🌉

Mix several MIDI loops into one composition by bridging
Sleeping

3

3

Faster Urdu ASR

🏎

Best Urdu speech to text using faster-whisper.
Running

1.22k

1.22k

Realistic Text To Speech Unlimited

🔥

Free Text-To-Speech generator with Emotion control (OpenAI)
Running on Zero

3

3

Orpheus Mono Melodies Mixer

🌉

Mix monophonic melodies into one composition by bridging
Running on Zero

3

3

Orpheus Pitches Inpainter

🖌

Inpaint pitches in any MIDI composition
Sleeping

1

1

Spark Anime Demo

🚀

A demo of how to Use Spark Anime model
Running

85

85

Qwen TTS Demo

💻

Generate speech from text with voice selection
Running on Zero

MCP

50

50

Voxtral

🗣

Demo space for Mistral latest speech models
Running

25

25

TTS Arena Legacy

🔥

Please vote on TTS Arena V2 instead
Running on Zero

135

135

MegaTTS 3 Voice Cloning

🎤

MegaTTS 3 but with voice cloning!
Running

59

59

Voxtral WebGPU

🐱

State-of-the-art audio transcription in your browser
Running

72

72

Music Arena Leaderboard

🎵

AI Music Arena & Leaderboard (Suno, Udio, Google, Meta, +)
Running on Zero

MCP

1

1

Kokoro TTS

❤

Upgraded to v1.0!
Running on Zero

15

15

Jam

🐠

Generate a song from lyrics and style reference
Running

51

51

Kitten TTS

🏆

SOTA Super-tiny TTS Model
Running

3

3

Granite Speech 3.3 Speech-To-Text

🚀

granite-speech-3.3-8b in a huggingface space
Running on Zero

9

9

SonicMaster – Text-Guided Music Restoration & Mastering

🎧

Enhance audio using text prompts
Running

1

1

Demucs Music Source Separation (v4)

⚡

Separate vocals from music
Running

4

4

Advanced MIDI Renderer (Genshin Impact Music)

❤

Transform and render any MIDI
Running on Zero

13

13

Ola

📊

Generate text and audio responses from images and videos

Upvote

Collection guide
Browse collections

Spaces for Audio / Voices

AICoverGen

SBV2 Chupa Demo

VisualNovel_sbv_demo

Moe TTS

Bert-VITS2 AI Abe&Suga&Kishida

AICoverGen

rvc-Blue-archives-hoyogames

VTuber RVC Models

RVC Inference HF

Audio🔹Separator

BlueArchiveTTS

Multi Voice TTS(English/Chinese/Japanese)

Stable Audio Open Zero

Applio

Voice Clone

RVC⚡ZERO

DiffSinger🎶 Diffusion for Singing Voice Synthesis

Ultimate Vocal Remover WebUI

Aesthetic RVC Inference HF

Advanced RVC Inference

Vits Models

Multilingual Anime TTS

LoveLive-ShojoKageki VITS

vits-uma-genshin-honkai

おしゃべり晋さんメーカー（Style-Bert-VITS2）

Hololive Style-Bert-VITS2

Midi Music Generator

Japanese Lyric Generator

VALL E X

AI晋さんメーカー

BangDream-ShojoKageki Bert VITS2

lovelive-ShojoKageki VITS JPZH

Lovelive-nijigasaki-MB-iSTFT-VITS-ZH&JP

Bark

OpenVoice

OpenVoiceV2

ChatTTS OpenVoice

MassivelyMultilingualTTS

XTTS

MusicGen

Seamless M4T v2

Mars5 Space

FAcodecV2

TTS x Hallo Talking Portrait

RVC Genshin Impact

FoleyCrafter

Voice Clone Multilingual

Talkalkai Cover

Image to Music v2

Whisper Timestamped

TTS Arena V2

TTSDS Benchmark and Leaderboard

LAKH MIDI Dataset Search

PicoAudio

Advanced MIDI Search

SenseVoice

Whisper Speaker Diarization

Faster Whisper Webui

Vocal Separation SOTA

BangDream-ShojoKageki Bert VITS2

BangDream-ShojoKageki Api

BangDream-ShojoKageki Bert VITS2

Efficient Audio Captioning

NaturalSpeech3 FACodec

tts Text To Speech

Edge Tts

JA TTS Arena

MIKU TTS

Genshin Music Generator

Advanced RVC Inference

Style Bert VITS2 MT

ZeroRVC

Edge TTS w/ More Options

EZ Voice Clone

Training Helper Rvc

Anitalker

rvc-Blue-archives

Fish Diffusion (HiFiSinger) Demo

Japanese Ero Voice Classifier