Spaces:

seanpedrickcase
/

Light-PDF-Web-QA-Chatbot

Running

App Files Files Community

Sean-Case commited on Jan 17, 2024

Commit

8aa3ebb

1 Parent(s): 6a76923

Minor dependency updates, increased max allowable layers for GPU

Browse files

Files changed (5) hide show

README.md +1 -1
app.py +13 -28
chatfuncs/chatfuncs.py +7 -4
chatfuncs/ingest.py +6 -24
requirements.txt +3 -2

README.md CHANGED Viewed

@@ -4,7 +4,7 @@ emoji: 🌍
 colorFrom: yellow
 colorTo: yellow
 sdk: gradio
-sdk_version: 3.35.2
 app_file: app.py
 pinned: false
 license: apache-2.0

 colorFrom: yellow
 colorTo: yellow
 sdk: gradio
+sdk_version: 3.50.0
 app_file: app.py
 pinned: false
 license: apache-2.0

app.py CHANGED Viewed

@@ -1,23 +1,17 @@
-# # Load in packages
-# +
 import os
-# Need to overwrite version of gradio present in Huggingface spaces as it doesn't have like buttons/avatars (Oct 2023)
-#os.system("pip uninstall -y gradio")
-os.system("pip install gradio==3.42.0")
-from typing import TypeVar
-from langchain.embeddings import HuggingFaceEmbeddings#, HuggingFaceInstructEmbeddings
-from langchain.vectorstores import FAISS
 import gradio as gr
 from transformers import AutoTokenizer
-# Alternative model sources
 from ctransformers import AutoModelForCausalLM
-PandasDataFrame = TypeVar('pd.core.frame.DataFrame')
 # Disable cuda devices if necessary
 #os.environ['CUDA_VISIBLE_DEVICES'] = '-1'
@@ -29,16 +23,8 @@ import chatfuncs.ingest as ing
 embeddings_name = "BAAI/bge-base-en-v1.5"
-def load_embeddings(embeddings_name = "BAAI/bge-base-en-v1.5"):
-    #if embeddings_name == "hkunlp/instructor-large":
-    #    embeddings_func = HuggingFaceInstructEmbeddings(model_name=embeddings_name,
-    #    embed_instruction="Represent the paragraph for retrieval: ",
-    #    query_instruction="Represent the question for retrieving supporting documents: "
-    #    )
-    #else:
     embeddings_func = HuggingFaceEmbeddings(model_name=embeddings_name)
     global embeddings
@@ -139,8 +125,8 @@ def load_model(model_type, gpu_layers, gpu_config=None, cpu_config=None, torch_d
     return model_type, load_confirmation, model_type
 # Both models are loaded on app initialisation so that users don't have to wait for the models to be downloaded
-#model_type = "Mistral Open Orca (larger, slow)"
-#load_model(model_type, chatf.gpu_layers, chatf.gpu_config, chatf.cpu_config, chatf.torch_device)
 model_type = "Flan Alpaca (small, fast)"
 load_model(model_type, 0, chatf.gpu_config, chatf.cpu_config, chatf.torch_device)
@@ -170,8 +156,8 @@ with block:
     ingest_docs = gr.State()
     model_type_state = gr.State(model_type)
-    embeddings_state = gr.State(globals()["embeddings"])
-    vectorstore_state = gr.State(globals()["vectorstore"])
     model_state = gr.State() # chatf.model (gives error)
     tokenizer_state = gr.State() # chatf.tokenizer (gives error)
@@ -213,8 +199,7 @@ with block:
                 "What are the 2030 outcomes for Lambeth?"])
-        current_topic = gr.Textbox(label="Feature currently disabled - Keywords related to current conversation topic.", placeholder="Keywords related to the conversation topic will appear here")
     with gr.Tab("Load in a different file to chat with"):
@@ -242,7 +227,7 @@ with block:
             model_choice = gr.Radio(label="Choose a chat model", value="Flan Alpaca (small, fast)", choices = ["Flan Alpaca (small, fast)", "Mistral Open Orca (larger, slow)"])
             change_model_button = gr.Button(value="Load model", scale=0)
         with gr.Accordion("Choose number of model layers to send to GPU (WARNING: please don't modify unless you are sure you have a GPU).", open = False):
-            gpu_layer_choice = gr.Slider(label="Choose number of model layers to send to GPU.", value=0, minimum=0, maximum=5, step = 1, visible=True)
         load_text = gr.Text(label="Load status")

+# Load in packages
 import os
+from typing import Type
+from langchain_community.embeddings import HuggingFaceEmbeddings#, HuggingFaceInstructEmbeddings
+from langchain_community.vectorstores import FAISS
 import gradio as gr
+import pandas as pd
 from transformers import AutoTokenizer
 from ctransformers import AutoModelForCausalLM
+PandasDataFrame = Type[pd.DataFrame]
 # Disable cuda devices if necessary
 #os.environ['CUDA_VISIBLE_DEVICES'] = '-1'
 embeddings_name = "BAAI/bge-base-en-v1.5"
+def load_embeddings(embeddings_name = embeddings_name):
     embeddings_func = HuggingFaceEmbeddings(model_name=embeddings_name)
     global embeddings
     return model_type, load_confirmation, model_type
 # Both models are loaded on app initialisation so that users don't have to wait for the models to be downloaded
+model_type = "Mistral Open Orca (larger, slow)"
+load_model(model_type, chatf.gpu_layers, chatf.gpu_config, chatf.cpu_config, chatf.torch_device)
 model_type = "Flan Alpaca (small, fast)"
 load_model(model_type, 0, chatf.gpu_config, chatf.cpu_config, chatf.torch_device)
     ingest_docs = gr.State()
     model_type_state = gr.State(model_type)
+    embeddings_state = gr.State(chatf.embeddings)#globals()["embeddings"])
+    vectorstore_state = gr.State(chatf.vectorstore)#globals()["vectorstore"])
     model_state = gr.State() # chatf.model (gives error)
     tokenizer_state = gr.State() # chatf.tokenizer (gives error)
                 "What are the 2030 outcomes for Lambeth?"])
+        current_topic = gr.Textbox(label="Feature currently disabled - Keywords related to current conversation topic.", placeholder="Keywords related to the conversation topic will appear here")
     with gr.Tab("Load in a different file to chat with"):
             model_choice = gr.Radio(label="Choose a chat model", value="Flan Alpaca (small, fast)", choices = ["Flan Alpaca (small, fast)", "Mistral Open Orca (larger, slow)"])
             change_model_button = gr.Button(value="Load model", scale=0)
         with gr.Accordion("Choose number of model layers to send to GPU (WARNING: please don't modify unless you are sure you have a GPU).", open = False):
+            gpu_layer_choice = gr.Slider(label="Choose number of model layers to send to GPU.", value=0, minimum=0, maximum=100, step = 1, visible=True)
         load_text = gr.Text(label="Load status")

chatfuncs/chatfuncs.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import re
 import os
 import datetime
-from typing import TypeVar, Dict, List, Tuple
 import time
 from itertools import compress
 import pandas as pd
@@ -17,8 +17,8 @@ from transformers import pipeline, TextIteratorStreamer
 # Langchain functions
 from langchain.prompts import PromptTemplate
-from langchain.vectorstores import FAISS
-from langchain.retrievers import SVMRetriever
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.docstore.document import Document
@@ -42,7 +42,7 @@ import gradio as gr
 torch.cuda.empty_cache()
-PandasDataFrame = TypeVar('pd.core.frame.DataFrame')
 embeddings = None  # global variable setup
 vectorstore = None # global variable setup
@@ -571,6 +571,8 @@ def hybrid_retrieval(new_question_kworded, vectorstore, embeddings, k_val, out_p
             vec_rank = [*range(1, docs_keep_length+1)]
             vec_score = [(docs_keep_length/x)*vec_weight for x in vec_rank]
             # 2nd level check on retrieved docs with BM25
             content_keep=[]
@@ -610,6 +612,7 @@ def hybrid_retrieval(new_question_kworded, vectorstore, embeddings, k_val, out_p
                         bm25_score.append((docs_keep_length/x)*bm25_weight)
             # 3rd level check on retrieved docs with SVM retriever
             svm_retriever = SVMRetriever.from_texts(content_keep, embeddings, k = k_val)
             svm_result = svm_retriever.get_relevant_documents(new_question_kworded)

 import re
 import os
 import datetime
+from typing import Type, Dict, List, Tuple
 import time
 from itertools import compress
 import pandas as pd
 # Langchain functions
 from langchain.prompts import PromptTemplate
+from langchain_community.vectorstores import FAISS
+from langchain_community.retrievers import SVMRetriever
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.docstore.document import Document
 torch.cuda.empty_cache()
+PandasDataFrame = Type[pd.DataFrame]
 embeddings = None  # global variable setup
 vectorstore = None # global variable setup
             vec_rank = [*range(1, docs_keep_length+1)]
             vec_score = [(docs_keep_length/x)*vec_weight for x in vec_rank]
+            print("Number of documents remaining: ", docs_keep_length)
             # 2nd level check on retrieved docs with BM25
             content_keep=[]
                         bm25_score.append((docs_keep_length/x)*bm25_weight)
             # 3rd level check on retrieved docs with SVM retriever
             svm_retriever = SVMRetriever.from_texts(content_keep, embeddings, k = k_val)
             svm_result = svm_retriever.get_relevant_documents(new_question_kworded)

chatfuncs/ingest.py CHANGED Viewed

@@ -1,21 +1,4 @@
-# ---
-# jupyter:
-#   jupytext:
-#     formats: ipynb,py:light
-#     text_representation:
-#       extension: .py
-#       format_name: light
-#       format_version: '1.5'
-#       jupytext_version: 1.14.6
-#   kernelspec:
-#     display_name: Python 3 (ipykernel)
-#     language: python
-#     name: python3
-# ---
-# # Ingest website to FAISS
-# ## Install/ import stuff we need
 import os
 from pathlib import Path
@@ -23,11 +6,11 @@ import re
 import requests
 import pandas as pd
 import dateutil.parser
-from typing import TypeVar, List
-from langchain.embeddings import HuggingFaceEmbeddings # HuggingFaceInstructEmbeddings,
-from langchain.vectorstores.faiss import FAISS
-from langchain.vectorstores import Chroma
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.docstore.document import Document
@@ -35,8 +18,7 @@ from bs4 import BeautifulSoup
 from docx import Document as Doc
 from pypdf import PdfReader
-PandasDataFrame = TypeVar('pd.core.frame.DataFrame')
-# -
 split_strat = ["\n\n", "\n", ". ", "! ", "? "]
 chunk_size = 500

+# Import package
 import os
 from pathlib import Path
 import requests
 import pandas as pd
 import dateutil.parser
+from typing import Type, List
+from langchain_community.embeddings import HuggingFaceEmbeddings # HuggingFaceInstructEmbeddings,
+from langchain_community.vectorstores.faiss import FAISS
+#from langchain_community.vectorstores import Chroma
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.docstore.document import Document
 from docx import Document as Doc
 from pypdf import PdfReader
+PandasDataFrame = Type[pd.DataFrame]
 split_strat = ["\n\n", "\n", ". ", "! ", "? "]
 chunk_size = 500

requirements.txt CHANGED Viewed

@@ -1,8 +1,9 @@
 langchain
 beautifulsoup4
 pandas
 transformers
---extra-index-url https://download.pytorch.org/whl/cu113
 torch
 sentence_transformers
 faiss-cpu
@@ -12,5 +13,5 @@ ctransformers[cuda]
 keybert
 span_marker
 gensim
-gradio==3.42.0
 gradio_client

 langchain
+langchain-community
 beautifulsoup4
 pandas
 transformers
+--extra-index-url https://download.pytorch.org/whl/cu118
 torch
 sentence_transformers
 faiss-cpu
 keybert
 span_marker
 gensim
+gradio==3.50.0
 gradio_client