Spaces:

ASLP-lab
/

WenetSpeech-Yue-TTS

Running on Zero

gz412 commited on Aug 25

Commit

a305f81

1 Parent(s): d8566f0

fix requirments

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,7 +2,7 @@ import spaces
 import sys
 import gradio as gr
 import opencc
-import torch
 # 添加第三方库路径
 sys.path.append('third_party/Matcha-TTS')
@@ -10,21 +10,36 @@ sys.path.append('third_party/Matcha-TTS')
 # 繁简转换
 converter = opencc.OpenCC('s2t.json')
-# ---- 预加载模型（只在启动时运行一次） ----
-from cosyvoice.cli.cosyvoice import CosyVoice2
-from cosyvoice.utils.file_utils import load_wav
-cosyvoice_base = CosyVoice2(
-    'ASLP-lab/WSYue-TTS-Cosyvoice2',
-    load_jit=False, load_trt=False, load_vllm=False, fp16=False
-)
-cosyvoice_zjg = CosyVoice2(
-    'ASLP-lab/WSYue-TTS-Cosyvoice2-zjg',
-    load_jit=False, load_trt=False, load_vllm=False, fp16=False
-)
 @spaces.GPU
 def tts_inference(model_choice, text, prompt_audio):
     # 选择模型和默认音频
     if model_choice == "CosyVoice2-张悦楷粤语评书":
         model = cosyvoice_zjg

 import sys
 import gradio as gr
 import opencc
+from huggingface_hub import hf_hub_download
 # 添加第三方库路径
 sys.path.append('third_party/Matcha-TTS')
 # 繁简转换
 converter = opencc.OpenCC('s2t.json')
+# ---- Lazy Import + 模型缓存 ----
+cosyvoice_base = None
+cosyvoice_zjg = None
+load_wav = None
+def load_models():
+    global cosyvoice_base, cosyvoice_zjg, load_wav
+    if cosyvoice_base is None or cosyvoice_zjg is None:
+        import torch
+        from cosyvoice.cli.cosyvoice import CosyVoice2
+        from cosyvoice.utils.file_utils import load_wav as _load_wav
+        load_wav = _load_wav
+        cosyvoice_base = CosyVoice2(
+            'ASLP-lab/WSYue-TTS-Cosyvoice2',
+            load_jit=False, load_trt=False, load_vllm=False, fp16=False
+        )
+        cosyvoice_zjg = CosyVoice2(
+            'ASLP-lab/WSYue-TTS-Cosyvoice2-zjg',
+            load_jit=False, load_trt=False, load_vllm=False, fp16=False
+        )
+    return cosyvoice_base, cosyvoice_zjg, load_wav
 @spaces.GPU
 def tts_inference(model_choice, text, prompt_audio):
+    import torch
+    cosyvoice_base, cosyvoice_zjg, load_wav = load_models()
     # 选择模型和默认音频
     if model_choice == "CosyVoice2-张悦楷粤语评书":
         model = cosyvoice_zjg