Spaces:

mwalker22
/

TMD-SDG-via-LangGraph

Sleeping

mwalker22 commited on Apr 27

Commit

8055f0d

1 Parent(s): c01c987

Replaced stubbed evolve.py code with an actual process of evolving the question.

Files changed (7) hide show

app.py CHANGED Viewed

@@ -5,6 +5,7 @@ from preprocess.html_to_documents import extract_documents_from_html
 from preprocess.embed_documents import create_or_load_vectorstore
 from graph.build_graph import build_sdg_graph
 from graph.types import SDGState
 # Configure logging
 logging.basicConfig(level=logging.DEBUG)
@@ -37,8 +38,11 @@ def initialize_resources():
     # Create vectorstore
     vectorstore = create_or_load_vectorstore(docs)
     # Build graph
-    graph = build_sdg_graph(docs, vectorstore)
     st.success("Resources initialized successfully!")
     return docs, vectorstore, graph

 from preprocess.embed_documents import create_or_load_vectorstore
 from graph.build_graph import build_sdg_graph
 from graph.types import SDGState
+from langchain_openai import ChatOpenAI
 # Configure logging
 logging.basicConfig(level=logging.DEBUG)
     # Create vectorstore
     vectorstore = create_or_load_vectorstore(docs)
+    # Initialize LLM client
+    llm = ChatOpenAI(model="gpt-3.5-turbo", openai_api_key=None)  # None will use env var
     # Build graph
+    graph = build_sdg_graph(docs, vectorstore, llm)
     st.success("Resources initialized successfully!")
     return docs, vectorstore, graph

graph/build_graph.py CHANGED Viewed

@@ -5,12 +5,12 @@ from graph.nodes.retrieve import retrieve_relevant_context
 from graph.nodes.answer import generate_answer
-def build_sdg_graph(docs, vectorstore) -> StateGraph:
     # Create a new graph with our state type
     builder = StateGraph(SDGState)
     # Add nodes with explicit state handling
-    builder.add_node("evolve", evolve_question)
     builder.add_node("retrieve", lambda state: retrieve_relevant_context(state, vectorstore))
     builder.add_node("generate_answer", generate_answer)

 from graph.nodes.answer import generate_answer
+def build_sdg_graph(docs, vectorstore, llm) -> StateGraph:
     # Create a new graph with our state type
     builder = StateGraph(SDGState)
     # Add nodes with explicit state handling
+    builder.add_node("evolve", lambda state: evolve_question(state, llm))
     builder.add_node("retrieve", lambda state: retrieve_relevant_context(state, vectorstore))
     builder.add_node("generate_answer", generate_answer)

graph/nodes/evolve.py CHANGED Viewed

@@ -4,14 +4,18 @@ import logging
 logger = logging.getLogger(__name__)
-def evolve_question(state: SDGState) -> SDGState:
     logger.debug(f"Evolve node received state: {state}")
-    # Create a new state with the evolved question
     new_state = SDGState(
         input=state.input,
         documents=state.documents,
-        evolved_question=f"Evolved version of: {state.input}",
         context=state.context,
         answer=state.answer
     )

 logger = logging.getLogger(__name__)
+def evolve_question(state: SDGState, llm) -> SDGState:
     logger.debug(f"Evolve node received state: {state}")
+    # Use the LLM to generate an evolved question
+    prompt = f"Rewrite or evolve the following question to be more challenging or insightful:\n\n{state.input}"
+    response = llm.invoke(prompt)
+    evolved_question = response.content if hasattr(response, 'content') else str(response)
     new_state = SDGState(
         input=state.input,
         documents=state.documents,
+        evolved_question=evolved_question,
         context=state.context,
         answer=state.answer
     )

main.py CHANGED Viewed

@@ -7,6 +7,7 @@ from pathlib import Path
 from graph.types import SDGState
 from preprocess.embed_documents import create_or_load_vectorstore
 from graph.build_graph import build_sdg_graph
 class DocumentEncoder(json.JSONEncoder):
@@ -70,7 +71,8 @@ def main():
         vectorstore = create_or_load_vectorstore(docs)
-        graph = build_sdg_graph(docs, vectorstore)
         initial_state = SDGState(input="How did LLMs evolve in 2023?")
         result = graph.invoke(initial_state)

 from graph.types import SDGState
 from preprocess.embed_documents import create_or_load_vectorstore
 from graph.build_graph import build_sdg_graph
+from langchain_openai import ChatOpenAI
 class DocumentEncoder(json.JSONEncoder):
         vectorstore = create_or_load_vectorstore(docs)
+        llm = ChatOpenAI(model="gpt-3.5-turbo", openai_api_key=None)  # None will use env var
+        graph = build_sdg_graph(docs, vectorstore, llm)
         initial_state = SDGState(input="How did LLMs evolve in 2023?")
         result = graph.invoke(initial_state)

tests/graph/nodes/test_evolve.py CHANGED Viewed

@@ -1,9 +1,12 @@
 from graph.types import SDGState
 from graph.nodes.evolve import evolve_question
 def test_evolve_question_modifies_state():
     state = SDGState(input="What were the top LLMs in 2023?")
-    updated_state = evolve_question(state)
-    assert updated_state.evolved_question.startswith("Evolved version of: ")
     assert updated_state.evolved_question.endswith("2023?")

 from graph.types import SDGState
 from graph.nodes.evolve import evolve_question
+from unittest.mock import MagicMock
 def test_evolve_question_modifies_state():
     state = SDGState(input="What were the top LLMs in 2023?")
+    mock_llm = MagicMock()
+    mock_llm.invoke.return_value = MagicMock(content="Evolved: What were the top LLMs in 2023?")
+    updated_state = evolve_question(state, mock_llm)
+    assert updated_state.evolved_question.startswith("Evolved:")
     assert updated_state.evolved_question.endswith("2023?")

tests/graph/test_build_graph.py CHANGED Viewed

@@ -9,8 +9,10 @@ def test_build_sdg_graph_runs():
     mock_vectorstore.similarity_search.return_value = [
         Document(page_content="Relevant content", metadata={})
     ]
-    graph = build_sdg_graph(docs, mock_vectorstore)
     state = SDGState(input="Test input", documents=docs)
     result = graph.invoke(state)

     mock_vectorstore.similarity_search.return_value = [
         Document(page_content="Relevant content", metadata={})
     ]
+    mock_llm = MagicMock()
+    mock_llm.invoke.return_value = MagicMock(content="Evolved test question")
+    graph = build_sdg_graph(docs, mock_vectorstore, mock_llm)
     state = SDGState(input="Test input", documents=docs)
     result = graph.invoke(state)

tests/test_main.py CHANGED Viewed

@@ -113,5 +113,5 @@ def test_main_runs_dev_mode(mock_dev, mock_docs, mock_vectorstore, mock_graph):
     mock_docs.assert_called_once()
     mock_vectorstore.assert_called_once()
-    mock_graph.assert_called_once_with(mock_docs.return_value, mock_vectorstore.return_value)
     mock_graph.return_value.invoke.assert_called_once()

     mock_docs.assert_called_once()
     mock_vectorstore.assert_called_once()
+    mock_graph.assert_called_once()
     mock_graph.return_value.invoke.assert_called_once()