Spaces:

Dovakiins
/

qwerrwe

Build error

Nanobit commited on Apr 5, 2024

Commit

bf4cd67

unverified ·

1 Parent(s): 05b0b7e

feat: validate sample packing requires flash_attention (#1465)

* feat: validate sample packing requires flash_attention

* fix: check for sdp_attn per suggestion

* feat: add FA to tests

Files changed (2) hide show

src/axolotl/utils/config/models/input/v0_4_1/__init__.py CHANGED Viewed

@@ -1,6 +1,7 @@
 """
 Module for pydantic models for configuration
 """
 # pylint: disable=too-many-lines
 import logging
@@ -655,6 +656,20 @@ class AxolotlInputConfig(
         return data
     @model_validator(mode="before")
     @classmethod
     def check_sample_packing_w_rl(cls, data):

 """
 Module for pydantic models for configuration
 """
 # pylint: disable=too-many-lines
 import logging
         return data
+    @model_validator(mode="before")
+    @classmethod
+    def check_sample_packing_wo_flash(cls, data):
+        if (
+            data.get("sample_packing")
+            and not data.get("flash_attention")
+            and not data.get("sdp_attention")
+        ):
+            raise ValueError(
+                "sample_packing requires flash_attention or sdp_attention to be set to true"
+            )
+        return data
     @model_validator(mode="before")
     @classmethod
     def check_sample_packing_w_rl(cls, data):

tests/test_validation.py CHANGED Viewed

@@ -600,6 +600,7 @@ class TestValidation(BaseValidation):
                 {
                     "sample_packing": True,
                     "pad_to_sequence_len": None,
                 }
             )
             | minimal_cfg
@@ -901,6 +902,7 @@ class TestValidation(BaseValidation):
                 {
                     "sample_packing": True,
                     "eval_table_size": 100,
                 }
             )
             | minimal_cfg
@@ -916,6 +918,7 @@ class TestValidation(BaseValidation):
                 {
                     "sample_packing": True,
                     "eval_sample_packing": False,
                 }
             )
             | minimal_cfg
@@ -928,6 +931,7 @@ class TestValidation(BaseValidation):
                 {
                     "sample_packing": False,
                     "eval_table_size": 100,
                 }
             )
             | minimal_cfg
@@ -941,6 +945,7 @@ class TestValidation(BaseValidation):
                     "sample_packing": True,
                     "eval_table_size": 100,
                     "eval_sample_packing": False,
                 }
             )
             | minimal_cfg

                 {
                     "sample_packing": True,
                     "pad_to_sequence_len": None,
+                    "flash_attention": True,
                 }
             )
             | minimal_cfg
                 {
                     "sample_packing": True,
                     "eval_table_size": 100,
+                    "flash_attention": True,
                 }
             )
             | minimal_cfg
                 {
                     "sample_packing": True,
                     "eval_sample_packing": False,
+                    "flash_attention": True,
                 }
             )
             | minimal_cfg
                 {
                     "sample_packing": False,
                     "eval_table_size": 100,
+                    "flash_attention": True,
                 }
             )
             | minimal_cfg
                     "sample_packing": True,
                     "eval_table_size": 100,
                     "eval_sample_packing": False,
+                    "flash_attention": True,
                 }
             )
             | minimal_cfg