Spaces:

Kapex13
/

tv_show_symantic

Sleeping

App Files Files Community

Kapex13 commited on Aug 10

Commit

6f2cd7f

verified ·

1 Parent(s): 736e359

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +67 -69

src/streamlit_app.py CHANGED Viewed

@@ -11,10 +11,10 @@ import ast
 import random
 import tempfile
-# 1. Удаляем блок с ручной установкой env vars
-# Streamlit должен работать с .streamlit/config.toml, который вы создали
-# 2. Пути к файлам относительно текущего скрипта
 HERE = os.path.dirname(os.path.abspath(__file__))
 CSV_PATH = os.path.join(HERE, "tvshows_processed2.csv")
 EMB_PATH = os.path.join(HERE, "embeddings.npy")
@@ -117,7 +117,7 @@ def load_embeddings_and_index():
 def semantic_search(query, embedder, index, df, genre=None, year=None, country=None, vtype=None, k=5):
     if not query.strip():
-        return pd.DataFrame() # Возвращаем пустой DataFrame, если запрос пуст
     query_embedding = embedder.encode([query])
     faiss.normalize_L2(query_embedding)
     dists, idxs = index.search(query_embedding, max(k*3, k))
@@ -167,110 +167,108 @@ def main():
     st.set_page_config(page_title="Поиск фильмов и сериалов + AI", layout="wide")
     st.title("Семантический поиск фильмов и сериалов с AI")
-    # 3. Инициализация состояния
-    if "search_clicked" not in st.session_state:
-        st.session_state.search_clicked = False
-    if "ai_clicked" not in st.session_state:
-        st.session_state.ai_clicked = False
-    if "query_input" not in st.session_state:
-        st.session_state.query_input = ""
-    if "genre_filter" not in st.session_state:
-        st.session_state.genre_filter = "Все"
-    if "year_filter" not in st.session_state:
-        st.session_state.year_filter = "Все"
-    if "country_filter" not in st.session_state:
-        st.session_state.country_filter = "Все"
-    if "type_filter" not in st.session_state:
-        st.session_state.type_filter = "Все"
     df = load_data()
     embedder = init_embedder()
     _, index = load_embeddings_and_index()
     llm = init_groq_llm()
-    # 4. Фильтры
     colf1, colf2, colf3, colf4 = st.columns(4)
     with colf1:
         genres = ["Все"] + sorted(set(sum([g.split(", ") for g in df["basic_genres"].dropna().unique()], [])))
-        st.session_state.genre_filter = st.selectbox("Жанр", genres, key="genre_filter_key")
     with colf2:
         years = ["Все"] + [str(y) for y in sorted(df["year"].unique())]
-        st.session_state.year_filter = st.selectbox("Год", years, key="year_filter_key")
     with colf3:
         countries = ["Все"] + sorted([c for c in df["country"].dropna().unique()])
-        st.session_state.country_filter = st.selectbox("Страна", countries, key="country_filter_key")
     with colf4:
         vtypes = ["Все"] + sorted(df["type"].dropna().unique())
-        st.session_state.type_filter = st.selectbox("Тип", vtypes, key="type_filter_key")
     k = st.slider("Количество результатов:", 1, 20, 5, key="k_slider")
     st.text_input("Введите ключевые слова или сюжет:", key="query_input")
-    # 5. Обработка кнопок
-    def handle_search(query):
-        st.session_state.query_input = query
         st.session_state.search_clicked = True
         st.session_state.ai_clicked = False
     nav1, nav2, nav3, nav4 = st.columns(4)
     with nav1:
         if st.button("Случайный фильм/сериал"):
-            handle_search(random.choice(df["tvshow_title"]))
     with nav2:
-        if st.button("ТОП по жанру") and st.session_state.genre_filter != "Все":
-            handle_search(st.session_state.genre_filter)
     with nav3:
         if st.button("Новинки"):
-            handle_search(str(max(df["year"])))
     with nav4:
         if st.button("Искать"):
-            handle_search(st.session_state.query_input)
     # 6. Отображение результатов
-    if st.session_state.search_clicked and st.session_state.query_input.strip():
         with st.spinner("Поиск..."):
-            results = semantic_search(
-                st.session_state.query_input, embedder, index, df,
-                st.session_state.genre_filter, st.session_state.year_filter,
-                st.session_state.country_filter, st.session_state.type_filter, k
             )
-        if results.empty:
-            st.warning("Ничего не найдено.")
-        else:
-            st.success(f"Найдено: {len(results)}")
-            for _, row in results.iterrows():
-                col1, col2 = st.columns([1, 3])
-                with col1:
-                    if row["image_url"]:
-                        try:
-                            st.image(row["image_url"], use_container_width=True)
-                        except Exception as e:
-                            st.info(f"Не удалось загрузить изображение: {e}")
-                    else:
-                        st.info("Нет изображения")
-                with col2:
-                    st.markdown(f"### {row['tvshow_title']} ({row['year']})")
-                    st.caption(f"{row['basic_genres']} | {row['country'] or '—'} | {row['rating'] or '—'} | {row['type']} | {row['num_seasons']} сез.")
-                    st.write(extract_intro_paragraph(row["description"]))
-                    if row["actors"]:
-                        st.caption(f"Актёры: {row['actors']}")
-                    if row["url"]:
-                        st.markdown(f"[Подробнее]({row['url']})")
-                st.divider()
-            # Кнопка для AI-рекомендаций должна быть вне цикла
-            if st.button("AI: почему эти подходят и что ещё посмотреть", key="ai_button"):
-                st.session_state.ai_clicked = True
-        # Сброс флага поиска
         st.session_state.search_clicked = False
-    if st.session_state.ai_clicked and "results" in locals() and not results.empty and llm is not None:
         st.markdown("### Рекомендации AI:")
         with st.spinner("Генерация ответа AI..."):
-            st.write(generate_rag_response(st.session_state.query_input, results, llm))
     st.sidebar.write(f"Всего записей: {len(df)}")

 import random
 import tempfile
+# Удаляем блок с ручной установкой env vars, так как он вызывает проблемы.
+# Streamlit должен работать с .streamlit/config.toml
+# Пути к файлам относительно текущего скрипта
 HERE = os.path.dirname(os.path.abspath(__file__))
 CSV_PATH = os.path.join(HERE, "tvshows_processed2.csv")
 EMB_PATH = os.path.join(HERE, "embeddings.npy")
 def semantic_search(query, embedder, index, df, genre=None, year=None, country=None, vtype=None, k=5):
     if not query.strip():
+        return pd.DataFrame()
     query_embedding = embedder.encode([query])
     faiss.normalize_L2(query_embedding)
     dists, idxs = index.search(query_embedding, max(k*3, k))
     st.set_page_config(page_title="Поиск фильмов и сериалов + AI", layout="wide")
     st.title("Семантический поиск фильмов и сериалов с AI")
+    # Инициализация состояния
+    for key, default in {
+        "query_input": "", "button_query": "", "genre_filter_key": "Все",
+        "year_filter_key": "Все", "country_filter_key": "Все",
+        "type_filter_key": "Все", "search_clicked": False, "ai_clicked": False, "results": pd.DataFrame()
+    }.items():
+        if key not in st.session_state:
+            st.session_state[key] = default
     df = load_data()
     embedder = init_embedder()
     _, index = load_embeddings_and_index()
     llm = init_groq_llm()
+    # Фильтры
     colf1, colf2, colf3, colf4 = st.columns(4)
     with colf1:
         genres = ["Все"] + sorted(set(sum([g.split(", ") for g in df["basic_genres"].dropna().unique()], [])))
+        st.selectbox("Жанр", genres, key="genre_filter_key")
     with colf2:
         years = ["Все"] + [str(y) for y in sorted(df["year"].unique())]
+        st.selectbox("Год", years, key="year_filter_key")
     with colf3:
         countries = ["Все"] + sorted([c for c in df["country"].dropna().unique()])
+        st.selectbox("Страна", countries, key="country_filter_key")
     with colf4:
         vtypes = ["Все"] + sorted(df["type"].dropna().unique())
+        st.selectbox("Тип", vtypes, key="type_filter_key")
     k = st.slider("Количество результатов:", 1, 20, 5, key="k_slider")
+    # Виджет ввода текста
     st.text_input("Введите ключевые слова или сюжет:", key="query_input")
+    # Обработка кнопок
+    def handle_button_click(query_from_button):
+        st.session_state.button_query = query_from_button
         st.session_state.search_clicked = True
         st.session_state.ai_clicked = False
     nav1, nav2, nav3, nav4 = st.columns(4)
     with nav1:
         if st.button("Случайный фильм/сериал"):
+            handle_button_click(random.choice(df["tvshow_title"]))
     with nav2:
+        if st.button("ТОП по жанру") and st.session_state.genre_filter_key != "Все":
+            handle_button_click(st.session_state.genre_filter_key)
     with nav3:
         if st.button("Новинки"):
+            handle_button_click(str(max(df["year"])))
     with nav4:
         if st.button("Искать"):
+            handle_button_click(st.session_state.query_input)
+    # Итоговый запрос для поиска - либо из текстового поля, либо от кнопки
+    final_query = st.session_state.button_query if st.session_state.search_clicked else st.session_state.query_input
     # 6. Отображение результатов
+    if st.session_state.search_clicked and final_query.strip():
         with st.spinner("Поиск..."):
+            st.session_state.results = semantic_search(
+                final_query, embedder, index, df,
+                st.session_state.genre_filter_key, st.session_state.year_filter_key,
+                st.session_state.country_filter_key, st.session_state.type_filter_key, k
             )
+        # Сброс флага после выполнения поиска, чтобы избежать "дрожания"
         st.session_state.search_clicked = False
+    # Отображение результатов поиска
+    if not st.session_state.results.empty:
+        st.success(f"Найдено: {len(st.session_state.results)}")
+        for _, row in st.session_state.results.iterrows():
+            col1, col2 = st.columns([1, 3])
+            with col1:
+                if row["image_url"]:
+                    try:
+                        st.image(row["image_url"], use_container_width=True)
+                    except:
+                        st.info("Нет изображения или не удалось загрузить")
+                else:
+                    st.info("Нет изображения")
+            with col2:
+                st.markdown(f"### {row['tvshow_title']} ({row['year']})")
+                st.caption(f"{row['basic_genres']} | {row['country'] or '—'} | {row['rating'] or '—'} | {row['type']} | {row['num_seasons']} сез.")
+                st.write(extract_intro_paragraph(row["description"]))
+                if row["actors"]:
+                    st.caption(f"Актёры: {row['actors']}")
+                if row["url"]:
+                    st.markdown(f"[Подробнее]({row['url']})")
+            st.divider()
+        # Кнопка для AI-рекомендаций должна быть вне цикла
+        if st.button("AI: почему эти подходят и что ещё посмотреть", key="ai_button"):
+            st.session_state.ai_clicked = True
+    elif st.session_state.search_clicked: # Отображаем предупреждение только если был поиск
+        st.warning("Ничего не найдено.")
+    if st.session_state.ai_clicked and not st.session_state.results.empty and llm is not None:
         st.markdown("### Рекомендации AI:")
         with st.spinner("Генерация ответа AI..."):
+            st.write(generate_rag_response(final_query, st.session_state.results, llm))
     st.sidebar.write(f"Всего записей: {len(df)}")