flan-t5

Runtime error

vasilee commited on Jun 9, 2023

Commit

b4aec05

1 Parent(s): 2a80116

Update main.py

Files changed (1) hide show

main.py CHANGED Viewed

@@ -16,14 +16,14 @@ def average_pool(last_hidden_states: Tensor,
 # text-ada replacement
 embeddingTokenizer = AutoTokenizer.from_pretrained(
-    './multilingual-e5-base')
-embeddingModel = AutoModel.from_pretrained('./multilingual-e5-base')
 # chatGpt replacement
 inferenceTokenizer = AutoTokenizer.from_pretrained(
-    "./ct2fast-flan-alpaca-xl")
 inferenceTranslator = Translator(
-    "./ct2fast-flan-alpaca-xl", compute_type="int8", device="cpu")
 class EmbeddingRequest(BaseModel):
@@ -99,7 +99,7 @@ async def tokens_count(request: TokensCountRequest):
         inferenceTokenizer.encode(input_text))
     # create response
-    response = {
         'tokens': tokens,
         'total': len(tokens)
     }

 # text-ada replacement
 embeddingTokenizer = AutoTokenizer.from_pretrained(
+    './models/multilingual-e5-base')
+embeddingModel = AutoModel.from_pretrained('./models/multilingual-e5-base')
 # chatGpt replacement
 inferenceTokenizer = AutoTokenizer.from_pretrained(
+    "./models/ct2fast-flan-alpaca-xl")
 inferenceTranslator = Translator(
+    "./models/ct2fast-flan-alpaca-xl", compute_type="int8", device="cpu")
 class EmbeddingRequest(BaseModel):
         inferenceTokenizer.encode(input_text))
     # create response
+    return {
         'tokens': tokens,
         'total': len(tokens)
     }