HaRin2806 commited on
Commit
0ca7e96
·
1 Parent(s): ea63ac5

update model in return chunk_id in API

Browse files
Files changed (2) hide show
  1. config.py +1 -1
  2. core/rag_pipeline.py +5 -2
config.py CHANGED
@@ -7,7 +7,7 @@ load_dotenv() # Tải biến môi trường từ file .env
7
  GEMINI_API_KEY = os.getenv("GEMINI_API_KEY", "YOUR_API_KEY_HERE")
8
 
9
  # Embedding model
10
- EMBEDDING_MODEL = "intfloat/multilingual-e5-base"
11
 
12
  # ChromaDB settings - sử dụng absolute path
13
  CHROMA_PERSIST_DIRECTORY = os.path.join(os.getcwd(), "chroma_db")
 
7
  GEMINI_API_KEY = os.getenv("GEMINI_API_KEY", "YOUR_API_KEY_HERE")
8
 
9
  # Embedding model
10
+ EMBEDDING_MODEL = "linhha2705/multilingual-e5-age"
11
 
12
  # ChromaDB settings - sử dụng absolute path
13
  CHROMA_PERSIST_DIRECTORY = os.path.join(os.getcwd(), "chroma_db")
core/rag_pipeline.py CHANGED
@@ -65,7 +65,8 @@ class RAGPipeline:
65
 
66
  # Thêm source reference
67
  source_info = {
68
- "title": metadata.get('title', metadata.get('chapter', 'Tài liệu dinh dưỡng')),
 
69
  "pages": metadata.get('pages'),
70
  "content_type": metadata.get('content_type', 'text')
71
  }
@@ -126,7 +127,9 @@ class RAGPipeline:
126
 
127
  # Thêm thông tin metadata
128
  context_str = f"[Tài liệu {i}]"
129
- if metadata.get('title'):
 
 
130
  context_str += f" - {metadata['title']}"
131
  if metadata.get('pages'):
132
  context_str += f" (Trang {metadata['pages']})"
 
65
 
66
  # Thêm source reference
67
  source_info = {
68
+ "chunk_id": metadata.get('chunk_id', 'unknown'),
69
+ "title": metadata.get('title', metadata.get('chapter', 'Tài liệu dinh dưỡng')), # Giữ title nếu cần
70
  "pages": metadata.get('pages'),
71
  "content_type": metadata.get('content_type', 'text')
72
  }
 
127
 
128
  # Thêm thông tin metadata
129
  context_str = f"[Tài liệu {i}]"
130
+ if metadata.get('chunk_id'):
131
+ context_str += f" - ID: {metadata['chunk_id']}"
132
+ elif metadata.get('title'):
133
  context_str += f" - {metadata['title']}"
134
  if metadata.get('pages'):
135
  context_str += f" (Trang {metadata['pages']})"