InstaDeepAI
/

ChatNT

Text Generation

feature-extraction

Model card Files Files and versions

Yanisadel commited on Jul 8

Commit

9ca04b0

·

verified ·

1 Parent(s): 6ed7d0b

Update text_generation.py

Files changed (1) hide show

text_generation.py +13 -8

text_generation.py CHANGED Viewed

@@ -55,19 +55,24 @@ class TextGenerationPipeline(Pipeline):
             truncation=True,
             max_length=english_tokens_max_length,
         ).input_ids
-        bio_tokens = self.bio_tokenizer(
-            dna_sequences,
-            return_tensors="pt",
-            padding="max_length",
-            max_length=bio_tokens_max_length,
-            truncation=True,
-        ).input_ids.unsqueeze(0)
         return {"english_tokens": english_tokens, "bio_tokens": bio_tokens}
     def _forward(self, model_inputs: dict, max_num_tokens_to_decode: int = 50) -> dict:
         english_tokens = model_inputs["english_tokens"].clone()
-        bio_tokens = model_inputs["bio_tokens"].clone()
         projected_bio_embeddings = None
         actual_num_steps = 0

             truncation=True,
             max_length=english_tokens_max_length,
         ).input_ids
+        if len(dna_sequences) == 0:
+            bio_tokens = None
+        else:
+            bio_tokens = self.bio_tokenizer(
+                dna_sequences,
+                return_tensors="pt",
+                padding="max_length",
+                max_length=bio_tokens_max_length,
+                truncation=True,
+            ).input_ids.unsqueeze(0)
         return {"english_tokens": english_tokens, "bio_tokens": bio_tokens}
     def _forward(self, model_inputs: dict, max_num_tokens_to_decode: int = 50) -> dict:
         english_tokens = model_inputs["english_tokens"].clone()
+        bio_tokens = model_inputs["bio_tokens"]
+        if bio_tokens is not None:
+            bio_tokens = bio_tokens.clone()
         projected_bio_embeddings = None
         actual_num_steps = 0