lgsantini1 commited on
Commit
ad7ebdc
·
verified ·
1 Parent(s): 350d79e

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +22 -22
app.py CHANGED
@@ -1,38 +1,38 @@
1
  import re
2
- import streamlit as st
3
  from youtube_transcript_api import YouTubeTranscriptApi
4
 
5
- # Função para extrair o ID do vídeo do YouTube
6
  def extract_video_id(youtube_url):
7
- # Regex para extrair o ID do vídeo
8
  match = re.search(r'(?:youtu\.be\/|(?:www\.)?youtube\.com\/(?:watch\?v=|embed\/|v\/|.+\?v=))([^&]{11})', youtube_url)
9
  return match.group(1) if match else None
10
 
11
- # Função para obter a transcrição do vídeo
12
  def get_transcript(video_id, language="en"):
13
  try:
14
  transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=[language])
15
- # Formata a transcrição em texto legível
16
  return "\n".join([f"{t['start']}: {t['text']}" for t in transcript])
17
  except Exception as e:
18
  return f"Erro ao obter transcrição: {str(e)}"
19
 
20
- # Configuração do Streamlit
21
- st.title("Obter Transcrição de Vídeos do YouTube")
22
- st.write("Insira a URL de um vídeo do YouTube e selecione o idioma para obter a transcrição (se disponível).")
23
-
24
- # Entrada da URL do vídeo
25
- youtube_url = st.text_input("URL do Vídeo (YouTube)", placeholder="Ex: https://www.youtube.com/watch?v=tl1jHm0qC_4")
26
-
27
- # Seleção do idioma
28
- language = st.selectbox("Idioma da Transcrição", ["en", "pt", "es", "fr"], index=0)
29
-
30
- # Botão para processar
31
- if st.button("Obter Transcrição"):
32
- # Validação da URL e obtenção da transcrição
33
  video_id = extract_video_id(youtube_url)
34
  if not video_id:
35
- st.error("Erro: URL inválida. Por favor, insira um link válido do YouTube.")
36
- else:
37
- transcript = get_transcript(video_id, language)
38
- st.text_area("Transcrição", value=transcript, height=400)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  import re
2
+ import gradio as gr
3
  from youtube_transcript_api import YouTubeTranscriptApi
4
 
 
5
  def extract_video_id(youtube_url):
6
+ # Regex para extrair o ID do vídeo da URL do YouTube
7
  match = re.search(r'(?:youtu\.be\/|(?:www\.)?youtube\.com\/(?:watch\?v=|embed\/|v\/|.+\?v=))([^&]{11})', youtube_url)
8
  return match.group(1) if match else None
9
 
 
10
  def get_transcript(video_id, language="en"):
11
  try:
12
  transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=[language])
 
13
  return "\n".join([f"{t['start']}: {t['text']}" for t in transcript])
14
  except Exception as e:
15
  return f"Erro ao obter transcrição: {str(e)}"
16
 
17
+ # Função que combina a extração do ID e a obtenção da transcrição
18
+ def gradio_interface(youtube_url, language):
 
 
 
 
 
 
 
 
 
 
 
19
  video_id = extract_video_id(youtube_url)
20
  if not video_id:
21
+ return "Erro: URL inválida. Por favor, insira um link válido do YouTube."
22
+
23
+ return get_transcript(video_id, language)
24
+
25
+ # Criação da interface Gradio
26
+ iface = gr.Interface(
27
+ fn=gradio_interface,
28
+ inputs=[
29
+ gr.Textbox(label="URL do Vídeo (YouTube)", placeholder="Ex: https://www.youtube.com/watch?v=tl1jHm0qC_4"),
30
+ gr.Dropdown(label="Idioma", choices=["en", "pt", "es", "fr"], value="en")
31
+ ],
32
+ outputs="text",
33
+ title="Obter Transcrição de Vídeos do YouTube",
34
+ description="Insira a URL de um vídeo do YouTube e selecione o idioma da transcrição."
35
+ )
36
+
37
+ # Execução da interface Gradio
38
+ iface.launch()