Spaces:

coffeebeans-ai
/

rfp_to_story

Sleeping

Darpan07 commited on Mar 15, 2024

Commit

7ef133a

verified ·

1 Parent(s): 2331243

Update Functions.py

Files changed (1) hide show

Functions.py CHANGED Viewed

@@ -170,20 +170,23 @@ class RFPProcessor:
                     )
         st.session_state["is_estimation_data_created"] = True
-    def process_rfp_data(self, project_name, file):
-        if project_name and file:
-            if file.name.endswith(".docx"):
-                st.session_state["rfp_details"] = read_docx(file)
-            elif file.name.endswith(".pdf"):
-                st.session_state["rfp_details"] = get_pdf_text(file)
-            else:
-                st.session_state["rfp_details"] = extract_text_from_file(file)
             # loader = PdfReader(file)
             # for i, page in enumerate(loader.pages):
             #     content = page.extract_text()
             #     if content:
             #         temp = st.session_state["rfp_details"]
             #         st.session_state["rfp_details"] = temp + content
             text_splitter = CharacterTextSplitter(
                 separator="\n", chunk_size=1000, chunk_overlap=150, length_function=len

                     )
         st.session_state["is_estimation_data_created"] = True
+    def process_rfp_data(self, project_name, files):
+        if project_name and files:
+            extracted_data = []
+            for file in files:
+                if file.name.endswith(".docx"):
+                    extracted_data.append(read_docx(file))
+                elif file.name.endswith(".pdf"):
+                    extracted_data.append(get_pdf_text(file))
+                else:
+                    extracted_data.append(extract_text_from_file(file))
             # loader = PdfReader(file)
             # for i, page in enumerate(loader.pages):
             #     content = page.extract_text()
             #     if content:
             #         temp = st.session_state["rfp_details"]
             #         st.session_state["rfp_details"] = temp + content
+            st.session_state["rfp_details"] = " ".join(extracted_data)
             text_splitter = CharacterTextSplitter(
                 separator="\n", chunk_size=1000, chunk_overlap=150, length_function=len