Spaces:

Maria15
/

tourist_rag

Sleeping

App Files Files Community

Maria15 commited on Jun 5

Commit

e37fa39

verified ·

1 Parent(s): 5f2f7d6

Upload 13 files

Browse files

Files changed (13) hide show

.gitignore +160 -0
LICENSE +21 -0
README.md +13 -20
__init__.py +0 -0
answer_rag.py +88 -0
app.py +73 -0
loader.py +51 -0
rag.py +73 -0
rag_local.py +72 -0
reader_llm.py +28 -0
requirements.txt +0 -0
reranker.py +42 -0
retrieval.py +24 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,160 @@

+# Byte-compiled / optimized / DLL files
+__pycache__/
+*.py[cod]
+*$py.class
+# C extensions
+*.so
+# Distribution / packaging
+.Python
+build/
+develop-eggs/
+dist/
+downloads/
+eggs/
+.eggs/
+lib/
+lib64/
+parts/
+sdist/
+var/
+wheels/
+share/python-wheels/
+*.egg-info/
+.installed.cfg
+*.egg
+MANIFEST
+# PyInstaller
+#  Usually these files are written by a python script from a template
+#  before PyInstaller builds the exe, so as to inject date/other infos into it.
+*.manifest
+*.spec
+# Installer logs
+pip-log.txt
+pip-delete-this-directory.txt
+# Unit test / coverage reports
+htmlcov/
+.tox/
+.nox/
+.coverage
+.coverage.*
+.cache
+nosetests.xml
+coverage.xml
+*.cover
+*.py,cover
+.hypothesis/
+.pytest_cache/
+cover/
+# Translations
+*.mo
+*.pot
+# Django stuff:
+*.log
+local_settings.py
+db.sqlite3
+db.sqlite3-journal
+# Flask stuff:
+instance/
+.webassets-cache
+# Scrapy stuff:
+.scrapy
+# Sphinx documentation
+docs/_build/
+# PyBuilder
+.pybuilder/
+target/
+# Jupyter Notebook
+.ipynb_checkpoints
+# IPython
+profile_default/
+ipython_config.py
+# pyenv
+#   For a library or package, you might want to ignore these files since the code is
+#   intended to run in multiple environments; otherwise, check them in:
+# .python-version
+# pipenv
+#   According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control.
+#   However, in case of collaboration, if having platform-specific dependencies or dependencies
+#   having no cross-platform support, pipenv may install dependencies that don't work, or not
+#   install all needed dependencies.
+#Pipfile.lock
+# poetry
+#   Similar to Pipfile.lock, it is generally recommended to include poetry.lock in version control.
+#   This is especially recommended for binary packages to ensure reproducibility, and is more
+#   commonly ignored for libraries.
+#   https://python-poetry.org/docs/basic-usage/#commit-your-poetrylock-file-to-version-control
+#poetry.lock
+# pdm
+#   Similar to Pipfile.lock, it is generally recommended to include pdm.lock in version control.
+#pdm.lock
+#   pdm stores project-wide configurations in .pdm.toml, but it is recommended to not include it
+#   in version control.
+#   https://pdm.fming.dev/#use-with-ide
+.pdm.toml
+# PEP 582; used by e.g. github.com/David-OConnor/pyflow and github.com/pdm-project/pdm
+__pypackages__/
+# Celery stuff
+celerybeat-schedule
+celerybeat.pid
+# SageMath parsed files
+*.sage.py
+# Environments
+.env
+.rag_venv
+env/
+venv/
+ENV/
+env.bak/
+venv.bak/
+# Spyder project settings
+.spyderproject
+.spyproject
+# Rope project settings
+.ropeproject
+# mkdocs documentation
+/site
+# mypy
+.mypy_cache/
+.dmypy.json
+dmypy.json
+# Pyre type checker
+.pyre/
+# pytype static type analyzer
+.pytype/
+# Cython debug symbols
+cython_debug/
+# PyCharm
+#  JetBrains specific template is maintained in a separate JetBrains.gitignore that can
+#  be found at https://github.com/github/gitignore/blob/main/Global/JetBrains.gitignore
+#  and can be added to the global gitignore or merged into this file.  For a more nuclear
+#  option (not recommended) you can uncomment the following to ignore the entire idea folder.
+#.idea/

LICENSE ADDED Viewed

	@@ -0,0 +1,21 @@

+MIT License
+Copyright (c) 2025 Maria
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+The above copyright notice and this permission notice shall be included in all
+copies or substantial portions of the Software.
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+SOFTWARE.

README.md CHANGED Viewed

@@ -1,20 +1,13 @@
----
-title: Tourist Rag
-emoji: 🚀
-colorFrom: red
-colorTo: red
-sdk: docker
-app_port: 8501
-tags:
-- streamlit
-pinned: false
-short_description: Streamlit template space
-license: mit
----
-# Welcome to Streamlit!
-Edit `/src/streamlit_app.py` to customize this app to your heart's desire. :heart:
-If you have any questions, checkout our [documentation](https://docs.streamlit.io) and [community
-forums](https://discuss.streamlit.io).

+                    Проект по NLP - туристический RAG-путеводитель
+Проект посвящен созданию туристического путеводителя по 4 городам России – Владимир, Ярославль, Екатеринбург и Нижний Новгород с помощью метода NLP, а именно подхода RAG.
+                     Данные:
+Данные представляют из себя таблицу (combinated_cities.csv), в которой по столбцам содержится информация о памятниках, архитектуре и других значимых местах для 4 городов. В данных есть столбцы:
+* Name - название достопримечательности;
+* City - город расположения;
+* Lon, Lat - координаты долготы и широты;
+* description - описание (извлеченное из WikiData);
+* image - изображение в формате base64;

__init__.py ADDED Viewed

File without changes

answer_rag.py ADDED Viewed

	@@ -0,0 +1,88 @@

+from transformers import Pipeline
+# from langchain.vectorstores import FAISS
+from langchain_community.vectorstores import FAISS
+from reranker import get_reranker, get_rag_prompt_template
+from typing import List, Tuple
+from langchain.docstore.document import Document as LangchainDocument
+import streamlit as st  # Добавляем импорт Streamlit
+def answer_with_rag2(
+    question: str,
+    llm: Pipeline,
+    knowledge_index: FAISS,
+    num_retrieved_docs: int = 30,
+    num_docs_final: int = 10,
+) -> Tuple[str, List[LangchainDocument]]:
+    # Собираем документы с помощью ретривера
+    st.write("=> Retrieving documents...")
+    relevant_docs = knowledge_index.similarity_search(query=question, k=num_retrieved_docs)
+    relevant_contents = [doc.page_content for doc in relevant_docs]
+    # Получаем ранкер (теперь это CrossEncoder)
+    reranker = get_reranker()
+    st.write("=> Reranking documents...")
+    try:
+        # CrossEncoder работает иначе, чем ColBERT
+        scores = reranker.predict([(question, doc) for doc in relevant_contents])
+        # Сортируем документы по убыванию релевантности
+        scored_docs = list(zip(relevant_docs, scores))
+        scored_docs.sort(key=lambda x: x[1], reverse=True)
+        # Отбираем топ документов
+        full_docs = [doc for doc, score in scored_docs[:num_docs_final]]
+        relevant_contents = [doc.page_content for doc in full_docs]
+    except Exception as e:
+        st.error(f"Ошибка при реранкинге: {e}")
+        full_docs = relevant_docs[:num_docs_final]
+        relevant_contents = relevant_contents[:num_docs_final]
+    # Формируем контекст для промпта
+    context = "\nExtracted documents:\n"
+    context += "".join([f"Document {i}:::\n{doc}\n" for i, doc in enumerate(relevant_contents)])
+    # st.write(context)
+    # Генерируем ответ
+    st.write("=> Generating answer...")
+    RAG_PROMPT_TEMPLATE = get_rag_prompt_template()
+    final_prompt = RAG_PROMPT_TEMPLATE.format(question=question, context=context)
+    # st.write(final_prompt)
+    answer = llm(final_prompt)[0]["generated_text"]
+    # Отображаем результаты с изображениями и координатами
+    st.markdown("\n## Ответ")
+    st.write(answer)
+    st.markdown("## Использованные источники")
+    for i, doc in enumerate(full_docs[:num_docs_final]):
+        with st.expander(f"Документ {i+1}"):
+            st.write(doc.page_content)
+            # Отображаем координаты
+            if hasattr(doc, 'metadata') and doc.metadata:
+                if "longitude" in doc.metadata and "latitude" in doc.metadata:
+                    st.write(f"📍 Широта: {doc.metadata['latitude']}, Долгота: {doc.metadata['longitude']}")
+                # Отображаем изображение
+                if "image" in doc.metadata and doc.metadata["image"]:
+                    try:
+                        if isinstance(doc.metadata["image"], str):
+                            if doc.metadata["image"].startswith('/9j/'):
+                                # Для base64 строк вида "data:image/png;base64,..."
+                                import base64
+                                from io import BytesIO
+                                from PIL import Image
+                                img_bytes = base64.b64decode(doc.metadata["image"])
+                                img = Image.open(BytesIO(img_bytes))
+                                st.image(img, caption=f"Изображение из документа {i+1}")
+                            else:
+                                # Предполагаем, что это путь к файлу
+                                st.image(doc.metadata["image"], caption=f"Изображение из документа {i+1}")
+                        elif isinstance(doc.metadata["image"], bytes):
+                            # Обработка бинарных данных изображения
+                            st.image(doc.metadata["image"], caption=f"Изображение из документа {i+1}")
+                    except Exception as e:
+                        st.error(f"Ошибка загрузки изображения: {str(e)}")
+    return answer, full_docs[:num_docs_final]

app.py ADDED Viewed

	@@ -0,0 +1,73 @@

+import os
+os.environ["TOKENIZERS_PARALLELISM"] = "false"
+os.environ["NO_CUDA_EXT"] = "1"
+from reader_llm import get_reader_llm
+from retrieval import get_retriever
+from answer_rag import answer_with_rag2
+import streamlit as st
+# Настройка страницы
+st.set_page_config(page_title="RAG", layout="wide")
+st.title("Туристический путеводитель")
+st.header("Города: Ярославль, Екатеринбург, Нижний Новгород, Владимир")
+@st.cache_resource
+def load_models():
+    READER_LLM = get_reader_llm(name="Vikhrmodels/Vikhr-Llama-3.2-1B-Instruct")
+    # READER_LLM = get_reader_llm(name="microsoft/phi-2") # легкая модель для приложения на сайте streamlit
+    embedding_model, KNOWLEDGE_VECTOR_DATABASE = get_retriever()
+    return READER_LLM, embedding_model, KNOWLEDGE_VECTOR_DATABASE
+READER_LLM, _, KNOWLEDGE_VECTOR_DATABASE = load_models()
+if "messages" not in st.session_state:
+    st.session_state.messages = []
+for message in st.session_state.messages:
+    with st.chat_message(message["role"]):
+        st.markdown(message["content"])
+if prompt := st.chat_input("Задайте Ваш вопрос"):
+    st.session_state.messages.append({"role": "user", "content": prompt})
+    with st.chat_message("user"):
+        st.markdown(prompt)
+    with st.chat_message("assistant"):
+        with st.spinner("Ищу информацию..."):
+            answer, sources = answer_with_rag2(
+                question=prompt,
+                llm=READER_LLM,
+                knowledge_index=KNOWLEDGE_VECTOR_DATABASE
+            )
+            st.markdown(answer)
+            # if sources:
+            #     st.markdown("**Источники информации:**")
+            #     for i, doc in enumerate(sources):
+            #         with st.expander(f"Источник {i+1}"):
+            #             st.write(doc.page_content)
+            #             if hasattr(doc, 'metadata'):
+            #                 if "latitude" in doc.metadata and "longitude" in doc.metadata:
+            #                     st.write(f"📍 Координаты: {doc.metadata['latitude']}, {doc.metadata['longitude']}")
+            #                 if "image" in doc.metadata and doc.metadata["image"]:
+            #                     try:
+            #                         if isinstance(doc.metadata["image"], str):
+            #                             if doc.metadata["image"].startswith('/9j/'):
+            #                                 import base64
+            #                                 from io import BytesIO
+            #                                 from PIL import Image
+            #                                 img_bytes = base64.b64decode(doc.metadata["image"])
+            #                                 img = Image.open(BytesIO(img_bytes))
+            #                                 st.image(img, caption=f"Изображение {i+1}")
+            #                             else:
+            #                                 st.image(doc.metadata["image"], caption=f"Изображение {i+1}")
+            #                         elif isinstance(doc.metadata["image"], bytes):
+            #                             st.image(doc.metadata["image"], caption=f"Изображение {i+1}")
+            #                     except Exception as e:
+            #                         st.error(f"Ошибка загрузки изображения: {str(e)}")
+        st.session_state.messages.append({"role": "assistant", "content": answer})

loader.py ADDED Viewed

	@@ -0,0 +1,51 @@

+import pandas as pd
+from langchain.docstore.document import Document as LangchainDocument
+from langchain.text_splitter import RecursiveCharacterTextSplitter
+def load_and_split_markdown(filepath='https://drive.google.com/u/0/uc?id=1JQswhvNz6yNKKzJW0nrXU7AmUQaGevxA&export=download'):
+    # Загрузка данных
+    data_cities = pd.read_csv(filepath)
+    # Создание документов без прогресс-бара
+    RAW_KNOWLEDGE_BASE = [
+        LangchainDocument(
+            page_content=f"{row['City']} | {row['Name']} | {row['description']}",
+            metadata={
+                "longitude": row['Lon'],
+                "latitude": row['Lat'],
+                "image": row['image'],
+                # "english_description": row['en_txt']
+            }
+        )
+        for _, row in data_cities.iterrows()  # Убрали tqdm
+    ]
+    # Настройки разделителя текста
+    MARKDOWN_SEPARATORS = [
+        "\n#{1,6} ",
+        "```\n",
+        "\n\\*\\*\\*+\n",
+        "\n---+\n",
+        "\n___+\n",
+        "\n\n",
+        "\n",
+        " ",
+        "",
+    ]
+    # Инициализация разделителя текста
+    text_splitter = RecursiveCharacterTextSplitter(
+        chunk_size=1000,
+        chunk_overlap=100,
+        add_start_index=True,
+        strip_whitespace=True,
+        separators=MARKDOWN_SEPARATORS,
+    )
+    # Разделение документов
+    docs_processed = []
+    for doc in RAW_KNOWLEDGE_BASE:
+        docs_processed += text_splitter.split_documents([doc])
+    return docs_processed

rag.py ADDED Viewed

	@@ -0,0 +1,73 @@

+import os
+os.environ["TOKENIZERS_PARALLELISM"] = "false"
+os.environ["NO_CUDA_EXT"] = "1"
+from reader_llm import get_reader_llm
+from retrieval import get_retriever
+from answer_rag import answer_with_rag2
+import streamlit as st
+# Настройка страницы
+st.set_page_config(page_title="RAG", layout="wide")
+st.title("Туристический путеводитель")
+st.header("Города: Ярославль, Екатеринбург, Нижний Новгород, Владимир")
+@st.cache_resource
+def load_models():
+    READER_LLM = get_reader_llm(name="Vikhrmodels/Vikhr-Llama-3.2-1B-Instruct")
+    # READER_LLM = get_reader_llm(name="microsoft/phi-2") # легкая модель для приложения на сайте streamlit
+    embedding_model, KNOWLEDGE_VECTOR_DATABASE = get_retriever()
+    return READER_LLM, embedding_model, KNOWLEDGE_VECTOR_DATABASE
+READER_LLM, _, KNOWLEDGE_VECTOR_DATABASE = load_models()
+if "messages" not in st.session_state:
+    st.session_state.messages = []
+for message in st.session_state.messages:
+    with st.chat_message(message["role"]):
+        st.markdown(message["content"])
+if prompt := st.chat_input("Задайте Ваш вопрос"):
+    st.session_state.messages.append({"role": "user", "content": prompt})
+    with st.chat_message("user"):
+        st.markdown(prompt)
+    with st.chat_message("assistant"):
+        with st.spinner("Ищу информацию..."):
+            answer, sources = answer_with_rag2(
+                question=prompt,
+                llm=READER_LLM,
+                knowledge_index=KNOWLEDGE_VECTOR_DATABASE
+            )
+            st.markdown(answer)
+            # if sources:
+            #     st.markdown("**Источники информации:**")
+            #     for i, doc in enumerate(sources):
+            #         with st.expander(f"Источник {i+1}"):
+            #             st.write(doc.page_content)
+            #             if hasattr(doc, 'metadata'):
+            #                 if "latitude" in doc.metadata and "longitude" in doc.metadata:
+            #                     st.write(f"📍 Координаты: {doc.metadata['latitude']}, {doc.metadata['longitude']}")
+            #                 if "image" in doc.metadata and doc.metadata["image"]:
+            #                     try:
+            #                         if isinstance(doc.metadata["image"], str):
+            #                             if doc.metadata["image"].startswith('/9j/'):
+            #                                 import base64
+            #                                 from io import BytesIO
+            #                                 from PIL import Image
+            #                                 img_bytes = base64.b64decode(doc.metadata["image"])
+            #                                 img = Image.open(BytesIO(img_bytes))
+            #                                 st.image(img, caption=f"Изображение {i+1}")
+            #                             else:
+            #                                 st.image(doc.metadata["image"], caption=f"Изображение {i+1}")
+            #                         elif isinstance(doc.metadata["image"], bytes):
+            #                             st.image(doc.metadata["image"], caption=f"Изображение {i+1}")
+            #                     except Exception as e:
+            #                         st.error(f"Ошибка загрузки изображения: {str(e)}")
+        st.session_state.messages.append({"role": "assistant", "content": answer})

rag_local.py ADDED Viewed

	@@ -0,0 +1,72 @@

+import os
+os.environ["TOKENIZERS_PARALLELISM"] = "false"
+os.environ["NO_CUDA_EXT"] = "1"
+from reader_llm import get_reader_llm
+from retrieval import get_retriever
+from answer_rag import answer_with_rag2
+import streamlit as st
+# Настройка страницы
+st.set_page_config(page_title="RAG", layout="wide")
+st.title("Туристический путеводитель")
+st.header("Города: Ярославль, Екатеринбург, Нижний Новгород, Владимир")
+@st.cache_resource
+def load_models():
+    READER_LLM = get_reader_llm()
+    embedding_model, KNOWLEDGE_VECTOR_DATABASE = get_retriever()
+    return READER_LLM, embedding_model, KNOWLEDGE_VECTOR_DATABASE
+READER_LLM, _, KNOWLEDGE_VECTOR_DATABASE = load_models()
+if "messages" not in st.session_state:
+    st.session_state.messages = []
+for message in st.session_state.messages:
+    with st.chat_message(message["role"]):
+        st.markdown(message["content"])
+if prompt := st.chat_input("Задайте Ваш вопрос"):
+    st.session_state.messages.append({"role": "user", "content": prompt})
+    with st.chat_message("user"):
+        st.markdown(prompt)
+    with st.chat_message("assistant"):
+        with st.spinner("Ищу информацию..."):
+            answer, sources = answer_with_rag2(
+                question=prompt,
+                llm=READER_LLM,
+                knowledge_index=KNOWLEDGE_VECTOR_DATABASE
+            )
+            st.markdown(answer)
+            # if sources:
+            #     st.markdown("**Источники информации:**")
+            #     for i, doc in enumerate(sources):
+            #         with st.expander(f"Источник {i+1}"):
+            #             st.write(doc.page_content)
+            #             if hasattr(doc, 'metadata'):
+            #                 if "latitude" in doc.metadata and "longitude" in doc.metadata:
+            #                     st.write(f"📍 Координаты: {doc.metadata['latitude']}, {doc.metadata['longitude']}")
+            #                 if "image" in doc.metadata and doc.metadata["image"]:
+            #                     try:
+            #                         if isinstance(doc.metadata["image"], str):
+            #                             if doc.metadata["image"].startswith('/9j/'):
+            #                                 import base64
+            #                                 from io import BytesIO
+            #                                 from PIL import Image
+            #                                 img_bytes = base64.b64decode(doc.metadata["image"])
+            #                                 img = Image.open(BytesIO(img_bytes))
+            #                                 st.image(img, caption=f"Изображение {i+1}")
+            #                             else:
+            #                                 st.image(doc.metadata["image"], caption=f"Изображение {i+1}")
+            #                         elif isinstance(doc.metadata["image"], bytes):
+            #                             st.image(doc.metadata["image"], caption=f"Изображение {i+1}")
+            #                     except Exception as e:
+            #                         st.error(f"Ошибка загрузки изображения: {str(e)}")
+        st.session_state.messages.append({"role": "assistant", "content": answer})

reader_llm.py ADDED Viewed

	@@ -0,0 +1,28 @@

+from transformers import pipeline
+from transformers import AutoTokenizer, AutoModelForCausalLM
+import torch
+def get_reader_llm(name="Qwen/Qwen2.5-3B-Instruct"):
+    READER_MODEL_NAME = name
+    # Для CPU-only лучше не использовать device_map
+    model = AutoModelForCausalLM.from_pretrained(
+        READER_MODEL_NAME,
+        torch_dtype=torch.float16,
+        low_cpu_mem_usage=True
+    )
+    tokenizer = AutoTokenizer.from_pretrained(READER_MODEL_NAME)
+    READER_LLM = pipeline(
+        model=model,
+        tokenizer=tokenizer,
+        task="text-generation",
+        # Убираем device, так как модель уже на CPU
+        do_sample=True,
+        temperature=0.2,
+        repetition_penalty=1.1,
+        return_full_text=False,
+        max_new_tokens=50  # Еще больше уменьшаем для надежности
+    )
+    return READER_LLM

requirements.txt CHANGED Viewed

Binary files a/requirements.txt and b/requirements.txt differ

reranker.py ADDED Viewed

	@@ -0,0 +1,42 @@

+import os
+os.environ["NO_CUDA_EXT"] = "1"  # Полностью отключаем C++ расширения
+from typing import Optional
+from sentence_transformers import CrossEncoder
+from transformers import AutoTokenizer
+def get_reranker(name: Optional[str] = None) -> CrossEncoder:
+    """
+    Инициализация ранкера с использованием CrossEncoder
+    """
+    # Используем более легкую модель по умолчанию
+    model_name = name or 'cross-encoder/ms-marco-MiniLM-L-6-v2'
+    return CrossEncoder(model_name)
+def get_rag_prompt_template():
+    prompt_in_chat_format = [
+        {
+            "role": "system",
+        "content": """Используй информацию из контекста, чтобы дать полный ответ на вопрос.
+    Отвечай только на заданный вопрос, ответ должен быть чётким и соответствующим вопросу.
+    Указывай номер исходного документа, когда это уместно.
+    Если ответ нельзя вывести из контекста, дай ответ,который знаешь, но обязательно напиши,что ответ дан не из контекста.
+    Отвечай строго на русском языке, даже если контекст содержит текст на других языках.""",  # Добавлено требование русского языка
+    },
+    {
+        "role": "user",
+        "content": """Контекст:
+   {context}
+   ---
+   Вот вопрос, на который нужно ответить.
+   Вопрос: {question}""",
+        }
+    ]
+    READER_MODEL_NAME="Qwen/Qwen2.5-3B-Instruct"
+    tokenizer = AutoTokenizer.from_pretrained(READER_MODEL_NAME)
+    return tokenizer.apply_chat_template(
+        prompt_in_chat_format,
+        tokenize=False,
+        add_generation_prompt=True
+    )

retrieval.py ADDED Viewed

	@@ -0,0 +1,24 @@

+from langchain_community.embeddings import HuggingFaceEmbeddings
+from loader import load_and_split_markdown
+# from langchain.vectorstores import FAISS
+from langchain_community.vectorstores import FAISS
+from langchain_community.vectorstores.utils import DistanceStrategy
+from huggingface_hub.utils import disable_progress_bars
+disable_progress_bars()  # Отключает прогресс-бары загрузки
+def get_retriever(name='intfloat/multilingual-e5-large'):
+    # Убираем multi_process для Windows
+    embedding_model = HuggingFaceEmbeddings(
+        model_name=name,
+        model_kwargs={"device": "cpu"},
+        encode_kwargs={
+            "normalize_embeddings": True,
+            "batch_size": 4  # Уменьшаем batch_size для CPU
+        }
+    )
+    docs_processed=load_and_split_markdown()
+    KNOWLEDGE_VECTOR_DATABASE = FAISS.from_documents(
+    documents=docs_processed, embedding=embedding_model, distance_strategy=DistanceStrategy.COSINE )
+    return embedding_model, KNOWLEDGE_VECTOR_DATABASE