Spaces:
Running
Running
HaRin2806
commited on
Commit
·
0ca7e96
1
Parent(s):
ea63ac5
update model in return chunk_id in API
Browse files- config.py +1 -1
- core/rag_pipeline.py +5 -2
config.py
CHANGED
@@ -7,7 +7,7 @@ load_dotenv() # Tải biến môi trường từ file .env
|
|
7 |
GEMINI_API_KEY = os.getenv("GEMINI_API_KEY", "YOUR_API_KEY_HERE")
|
8 |
|
9 |
# Embedding model
|
10 |
-
EMBEDDING_MODEL = "
|
11 |
|
12 |
# ChromaDB settings - sử dụng absolute path
|
13 |
CHROMA_PERSIST_DIRECTORY = os.path.join(os.getcwd(), "chroma_db")
|
|
|
7 |
GEMINI_API_KEY = os.getenv("GEMINI_API_KEY", "YOUR_API_KEY_HERE")
|
8 |
|
9 |
# Embedding model
|
10 |
+
EMBEDDING_MODEL = "linhha2705/multilingual-e5-age"
|
11 |
|
12 |
# ChromaDB settings - sử dụng absolute path
|
13 |
CHROMA_PERSIST_DIRECTORY = os.path.join(os.getcwd(), "chroma_db")
|
core/rag_pipeline.py
CHANGED
@@ -65,7 +65,8 @@ class RAGPipeline:
|
|
65 |
|
66 |
# Thêm source reference
|
67 |
source_info = {
|
68 |
-
"
|
|
|
69 |
"pages": metadata.get('pages'),
|
70 |
"content_type": metadata.get('content_type', 'text')
|
71 |
}
|
@@ -126,7 +127,9 @@ class RAGPipeline:
|
|
126 |
|
127 |
# Thêm thông tin metadata
|
128 |
context_str = f"[Tài liệu {i}]"
|
129 |
-
if metadata.get('
|
|
|
|
|
130 |
context_str += f" - {metadata['title']}"
|
131 |
if metadata.get('pages'):
|
132 |
context_str += f" (Trang {metadata['pages']})"
|
|
|
65 |
|
66 |
# Thêm source reference
|
67 |
source_info = {
|
68 |
+
"chunk_id": metadata.get('chunk_id', 'unknown'),
|
69 |
+
"title": metadata.get('title', metadata.get('chapter', 'Tài liệu dinh dưỡng')), # Giữ title nếu cần
|
70 |
"pages": metadata.get('pages'),
|
71 |
"content_type": metadata.get('content_type', 'text')
|
72 |
}
|
|
|
127 |
|
128 |
# Thêm thông tin metadata
|
129 |
context_str = f"[Tài liệu {i}]"
|
130 |
+
if metadata.get('chunk_id'):
|
131 |
+
context_str += f" - ID: {metadata['chunk_id']}"
|
132 |
+
elif metadata.get('title'):
|
133 |
context_str += f" - {metadata['title']}"
|
134 |
if metadata.get('pages'):
|
135 |
context_str += f" (Trang {metadata['pages']})"
|