feat: add lora instructions for retrieval

Signed-off-by: Meow <[email protected]>

Files changed (2) hide show

configuration_xlm_roberta.py CHANGED Viewed

@@ -27,7 +27,7 @@ class XLMRobertaFlashConfig(PretrainedConfig):
         use_cache: bool = True,
         classifier_dropout: Optional[float] = None,
         lora_adaptations: Optional[List[str]] = None,
-        lora_prompts: Optional[Dict[str, str]] = None,
         lora_rank: int = 4,
         lora_dropout_p: float = 0.0,
         lora_alpha: int = 1,
@@ -103,7 +103,7 @@ class XLMRobertaFlashConfig(PretrainedConfig):
         self.classifier_dropout = classifier_dropout
         self.load_trained_adapters = load_trained_adapters
         self.lora_adaptations = lora_adaptations
-        self.lora_prompts = lora_prompts
         self.lora_rank = lora_rank
         self.lora_dropout_p = lora_dropout_p
         self.lora_alpha = lora_alpha

         use_cache: bool = True,
         classifier_dropout: Optional[float] = None,
         lora_adaptations: Optional[List[str]] = None,
+        task_instructions: Optional[Dict[str, str]] = None,
         lora_rank: int = 4,
         lora_dropout_p: float = 0.0,
         lora_alpha: int = 1,
         self.classifier_dropout = classifier_dropout
         self.load_trained_adapters = load_trained_adapters
         self.lora_adaptations = lora_adaptations
+        self.task_instructions = task_instructions
         self.lora_rank = lora_rank
         self.lora_dropout_p = lora_dropout_p
         self.lora_alpha = lora_alpha

modeling_lora.py CHANGED Viewed

@@ -258,15 +258,15 @@ class XLMRobertaLoRA(XLMRobertaPreTrainedModel):
             raise ValueError(
                 f"`lora_adaptations` must be a list and contain at least one element"
             )
-        self._lora_prompts = config.lora_prompts
         if (
-            not isinstance(self._lora_prompts, dict)
-            or len(self._lora_prompts) != len(self._lora_adaptations)
-            or not all([v in self._lora_adaptations for v in self._lora_prompts.keys()])
         ):
             raise ValueError(
-                f"`lora_prompts` must be a dict and contain the same number of elements "
-                f"as `lora_adaptations` with all keys in `lora_prompts` present in `lora_adaptations`."
             )
         self._adaptation_map = {
             name: idx for idx, name in enumerate(self._lora_adaptations)
@@ -393,6 +393,8 @@ class XLMRobertaLoRA(XLMRobertaPreTrainedModel):
             adapter_mask = torch.full(
                 (num_examples,), task_id, dtype=torch.int32, device=self.device
             )
         return self.roberta.encode(
             sentences, *args, adapter_mask=adapter_mask, **kwargs
         )

             raise ValueError(
                 f"`lora_adaptations` must be a list and contain at least one element"
             )
+        self._task_instructions = config.task_instructions
         if (
+            not isinstance(self._task_instructions, dict)
+            or len(self._task_instructions) != len(self._lora_adaptations)
+            or not all([v in self._lora_adaptations for v in self._task_instructions.keys()])
         ):
             raise ValueError(
+                f"`task_instructions` must be a dict and contain the same number of elements "
+                f"as `lora_adaptations` with all keys in `task_instructions` present in `lora_adaptations`."
             )
         self._adaptation_map = {
             name: idx for idx, name in enumerate(self._lora_adaptations)
             adapter_mask = torch.full(
                 (num_examples,), task_id, dtype=torch.int32, device=self.device
             )
+        if task_type in ['query', 'passage']:
+            sentences = [self._task_instructions[task_type] + ' ' + sentence for sentence in sentences]
         return self.roberta.encode(
             sentences, *args, adapter_mask=adapter_mask, **kwargs
         )