Spaces:

ekaterina-simonova
/

NK_pomogator

Runtime error

App Files Files Community

ekaterina-simonova commited on Jul 15

Commit

760dccb

verified ·

1 Parent(s): 3f4faae

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -43

app.py CHANGED Viewed

@@ -621,7 +621,10 @@ def save_log(question, answer):
 # Поиск ответа
 def get_answer(question):
-    # 1. Проверка специальных случаев
     if "метролог" in question.lower():
         conn = get_db_connection(SQLITE_DB_PATH)
         cursor = conn.cursor()
@@ -635,70 +638,65 @@ def get_answer(question):
         conn.close()
         if result:
-            answer = f"📌 {result['chunk_text']}\n\n📚 Источник: {result['doc_type_short'] or '?'} {result['doc_number'] or ''} {result['file_name'] or ''}".strip()
-            save_log(question, answer)
-            return answer
     # 2. Поиск в Excel
     qa_df = load_data()
-    responses = []
-    sources = []
     for _, row in qa_df.iterrows():
         table_question = str(row['Вопрос']).lower()
         if fuzz.partial_ratio(question.lower(), table_question) > 85:
             response = re.sub(r"^[a-zA-Zа-яА-Я]$\s*", "", str(row['Правильный ответ']))
             source = str(row['Источник ответа']) if pd.notna(row['Источник ответа']) else "?"
-            responses.append(response)
-            sources.append(source)
-    if responses:
-        unique_responses = list(set(responses))
-        unique_sources = list(set(sources))
-        answer = f"📌 {', '.join(unique_responses)}"
-        if unique_sources and not all(source == "?" for source in unique_sources):
-            answer += f"\n\n📚 Источник: {', '.join([s for s in unique_sources if s != '?'])}"
-        save_log(question, answer)
-        return answer
-    # 3. Гибридный поиск (векторный + BM25)
     hybrid_results = hybrid_search_results(question)
     if hybrid_results:
         try:
-            # Генерация ответа с помощью GPT
-            gpt_answer = generate_gpt_response(question, hybrid_results)
             # Формируем полный ответ
-            answer = f"🤖 Сгенерированный ответ:\n\n{gpt_answer}\n\n"
-            answer += "🔍 Использованные фрагменты документов:\n\n"
-            for i, res in enumerate(hybrid_results, 1):
-                answer += f"### Фрагмент {i} (метод: {res['type']}, оценка: {res['combined_score']:.2f})\n"
-                answer += f"{res['text']}\n"
-                answer += f"\n📚 Источник: {res['source']}\n\n"
             save_log(question, answer)
             return answer
         except Exception as e:
-            logger.error(f"Ошибка при формировании гибридного ответа: {str(e)}")
-    # 4. Обычный поиск
-    results = search_in_knowledge_base(question)
-    if not results.empty:
-        answer = "Найдены следующие релевантные фрагменты:\n\n"
-        for idx, row in results.iterrows():
-            source_parts = [
-                str(row['doc_type_short']) if pd.notna(row['doc_type_short']) else None,
-                str(row['doc_number']) if pd.notna(row['doc_number']) else None,
-                str(row['file_name']) if pd.notna(row['file_name']) else None
-            ]
-            source = " ".join(filter(None, source_parts)) or "Источник не указан"
-            answer += f"### Фрагмент {idx+1}\n"
-            answer += f"{row['chunk_text']}\n"
-            answer += f"\n📚 Источник: {source}\n\n"
         save_log(question, answer)
         return answer

 # Поиск ответа
 def get_answer(question):
+    # Получаем все релевантные результаты
+    results = []
+    # 1. Проверка в базе данных
     if "метролог" in question.lower():
         conn = get_db_connection(SQLITE_DB_PATH)
         cursor = conn.cursor()
         conn.close()
         if result:
+            results.append({
+                "text": result['chunk_text'],
+                "source": f"{result['doc_type_short'] or '?'} {result['doc_number'] or ''} {result['file_name'] or ''}".strip(),
+                "score": 1.0,
+                "type": "exact"
+            })
     # 2. Поиск в Excel
     qa_df = load_data()
+    excel_responses = []
+    excel_sources = []
     for _, row in qa_df.iterrows():
         table_question = str(row['Вопрос']).lower()
         if fuzz.partial_ratio(question.lower(), table_question) > 85:
             response = re.sub(r"^[a-zA-Zа-яА-Я]$\s*", "", str(row['Правильный ответ']))
             source = str(row['Источник ответа']) if pd.notna(row['Источник ответа']) else "?"
+            excel_responses.append(response)
+            excel_sources.append(source)
+    if excel_responses:
+        results.append({
+            "text": ", ".join(set(excel_responses)),
+            "source": ", ".join([s for s in set(excel_sources) if s != '?']),
+            "score": 1.0,
+            "type": "excel"
+        })
+    # 3. Гибридный поиск
     hybrid_results = hybrid_search_results(question)
     if hybrid_results:
+        results.extend(hybrid_results)
+    # Если есть результаты, генерируем ответ с помощью GPT
+    if results:
         try:
+            gpt_answer = generate_gpt_response(question, results)
             # Формируем полный ответ
+            answer = f"🤖 Ответ:\n\n{gpt_answer}\n\n"
+            answer += "🔍 Использованные источники:\n\n"
+            for i, res in enumerate(results, 1):
+                answer += f"### Источник {i}\n"
+                answer += f"{res['source']}\n\n"
             save_log(question, answer)
             return answer
         except Exception as e:
+            logger.error(f"Ошибка при генерации ответа GPT: {str(e)}")
+    # 4. Если не удалось сгенерировать ответ через GPT, возвращаем обычный поиск
+    if results:
+        answer = "Найдены следующие релевантные фрагменты:\n\n"
+        for idx, res in enumerate(results, 1):
+            answer += f"### Фрагмент {idx}\n"
+            answer += f"{res['text']}\n"
+            answer += f"\n📚 Источник: {res['source']}\n\n"
         save_log(question, answer)
         return answer