Spaces:

minhan6559
/

viettelpay-chatbot

Sleeping

App Files Files Community

minhan6559 commited on Jun 15

Commit

60d1d13

verified ·

1 Parent(s): 8e735a4

Upload 73 files

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.env +9 -0
.gitattributes +4 -35
.gitignore +2 -0
.streamlit/secrets.toml +23 -0
evaluation_data/datasets/intent_classification/viettelpay_intent_dataset.json +0 -0
evaluation_data/datasets/multi_turn_retrieval/viettelpay_multiturn_conversations.json +0 -0
evaluation_data/datasets/multi_turn_retrieval/viettelpay_multiturn_enhanced.json +0 -0
evaluation_data/datasets/single_turn_retrieval/viettelpay_complete_eval.json +0 -0
evaluation_data/results/intent_classification/viettelpay_intent_results.json +0 -0
evaluation_data/results/multi_turn_retrieval/viettelpay_multiturn_results.json +0 -0
evaluation_data/results/single_turn_retrieval/viettelpay_eval_results.json +0 -0
knowledge_base/chroma/c8c2137c-264c-4fe5-a301-20b02985da11/data_level0.bin +3 -0
knowledge_base/chroma/c8c2137c-264c-4fe5-a301-20b02985da11/header.bin +0 -0
knowledge_base/chroma/c8c2137c-264c-4fe5-a301-20b02985da11/length.bin +0 -0
knowledge_base/chroma/c8c2137c-264c-4fe5-a301-20b02985da11/link_lists.bin +0 -0
knowledge_base/chroma/chroma.sqlite3 +3 -0
requirements.txt +31 -2
src/__pycache__/knowledge_base_builder.cpython-310.pyc +0 -0
src/__pycache__/knowledge_base_builder.cpython-312.pyc +0 -0
src/__pycache__/simplified_knowledge_base.cpython-310.pyc +0 -0
src/agent/__pycache__/memory.cpython-311.pyc +0 -0
src/agent/__pycache__/nodes.cpython-310.pyc +0 -0
src/agent/__pycache__/nodes.cpython-311.pyc +0 -0
src/agent/__pycache__/prompts.cpython-311.pyc +0 -0
src/agent/__pycache__/scripts.cpython-310.pyc +0 -0
src/agent/__pycache__/scripts.cpython-311.pyc +0 -0
src/agent/__pycache__/viettelpay_agent.cpython-310.pyc +0 -0
src/agent/__pycache__/viettelpay_agent.cpython-311.pyc +0 -0
src/agent/nodes.py +463 -0
src/agent/prompts.py +125 -0
src/agent/scripts.py +157 -0
src/agent/viettelpay_agent.py +416 -0
src/evaluation/__pycache__/prompts.cpython-311.pyc +0 -0
src/evaluation/__pycache__/single_turn_retrieval.cpython-311.pyc +0 -0
src/evaluation/intent_classification.py +901 -0
src/evaluation/multi_turn_retrieval.py +815 -0
src/evaluation/prompts.py +318 -0
src/evaluation/single_turn_retrieval.py +844 -0
src/knowledge_base/__pycache__/builder.cpython-310.pyc +0 -0
src/knowledge_base/__pycache__/builder.cpython-311.pyc +0 -0
src/knowledge_base/__pycache__/viettel_knowledge_base.cpython-311.pyc +0 -0
src/knowledge_base/viettel_knowledge_base.py +521 -0
src/llm/__pycache__/langchain_models.cpython-311.pyc +0 -0
src/llm/__pycache__/llm_client.cpython-310.pyc +0 -0
src/llm/__pycache__/llm_client.cpython-311.pyc +0 -0
src/llm/llm_client.py +181 -0
src/processor/__pycache__/contextual_word_processor.cpython-311.pyc +0 -0
src/processor/__pycache__/csv_processor.cpython-310.pyc +0 -0
src/processor/__pycache__/csv_processor.cpython-311.pyc +0 -0
src/processor/__pycache__/csv_processor.cpython-312.pyc +0 -0

.env ADDED Viewed

	@@ -0,0 +1,9 @@

+# .env file
+GEMINI_API_KEY="AIzaSyAn1HDv1_zU4TQbwwUtBIOo7tu5iKVBWho"
+GOOGLE_API_KEY="AIzaSyAn1HDv1_zU4TQbwwUtBIOo7tu5iKVBWho"
+OPENAI_API_KEY="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"
+COHERE_API_KEY="D6PBHYizSmWFqzHoMWafV65yJelDh6X3Xg0ghIue"
+# Production
+# COHERE_API_KEY="VFaacPxkjW0L4HaijiBXuKYWqgYj8XkAo3o5uMWu"

.gitattributes CHANGED Viewed

@@ -1,35 +1,4 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

+# Auto detect text files and perform LF normalization
+* text=auto
+knowledge_base/chroma/c8c2137c-264c-4fe5-a301-20b02985da11/data_level0.bin filter=lfs diff=lfs merge=lfs -text
+knowledge_base/chroma/chroma.sqlite3 filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ .env
2	+ secrets.toml

.streamlit/secrets.toml ADDED Viewed

	@@ -0,0 +1,23 @@

+# Streamlit Secrets Configuration
+# Copy your API keys here for production
+# For local development, you can still use .env file
+[api_keys]
+GEMINI_API_KEY = "AIzaSyAn1HDv1_zU4TQbwwUtBIOo7tu5iKVBWho"
+OPENAI_API_KEY = "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"
+COHERE_API_KEY = "D6PBHYizSmWFqzHoMWafV65yJelDh6X3Xg0ghIue"
+# Production
+# COHERE_API_KEY="VFaacPxkjW0L4HaijiBXuKYWqgYj8XkAo3o5uMWu"
+# Database and storage paths
+[paths]
+KNOWLEDGE_BASE_PATH = "./knowledge_base"
+DOCUMENTS_FOLDER = "./viettelpay_docs"
+# Model configurations
+[models]
+EMBEDDING_MODEL = "dangvantuan/vietnamese-document-embedding"
+LLM_PROVIDER = "gemini"
+GEMINI_MODEL = "gemini-2.0-flash"
+OPENAI_MODEL = "gpt-4o-mini"

evaluation_data/datasets/intent_classification/viettelpay_intent_dataset.json ADDED Viewed