Update gigaam_transformers.py

Files changed (1) hide show

gigaam_transformers.py CHANGED Viewed

@@ -276,9 +276,9 @@ class GigaAMFeatureExtractor(SequenceFeatureExtractor):
         return BatchFeature({"input_features": input_features, "input_lengths": input_lengths}, tensor_type="pt")
-class GigaAMCTCTokenizer(Wav2Vec2CTCTokenizer):
     """
-    Char tokenizer for GigaAM-CTC model.
     """
     def __init__(
         self,
@@ -303,7 +303,7 @@ class GigaAMCTCTokenizer(Wav2Vec2CTCTokenizer):
 class GigaAMProcessor(Wav2Vec2Processor):
     feature_extractor_class = "GigaAMFeatureExtractor"
-    tokenizer_class = "GigaAMCTCTokenizer"
     def __init__(self, feature_extractor, tokenizer):
         # super().__init__(feature_extractor, tokenizer)
@@ -315,7 +315,7 @@ class GigaAMProcessor(Wav2Vec2Processor):
     @classmethod
     def from_pretrained(cls, pretrained_model_name_or_path, **kwargs):
         feature_extractor = GigaAMFeatureExtractor.from_pretrained(pretrained_model_name_or_path, **kwargs)
-        tokenizer = GigaAMCTCTokenizer.from_pretrained(pretrained_model_name_or_path, **kwargs)
         return cls(feature_extractor=feature_extractor, tokenizer=tokenizer)

         return BatchFeature({"input_features": input_features, "input_lengths": input_lengths}, tensor_type="pt")
+class GigaAMTokenizer(Wav2Vec2CTCTokenizer):
     """
+    Char tokenizer for GigaAM model.
     """
     def __init__(
         self,
 class GigaAMProcessor(Wav2Vec2Processor):
     feature_extractor_class = "GigaAMFeatureExtractor"
+    tokenizer_class = "GigaAMTokenizer"
     def __init__(self, feature_extractor, tokenizer):
         # super().__init__(feature_extractor, tokenizer)
     @classmethod
     def from_pretrained(cls, pretrained_model_name_or_path, **kwargs):
         feature_extractor = GigaAMFeatureExtractor.from_pretrained(pretrained_model_name_or_path, **kwargs)
+        tokenizer = GigaAMTokenizer.from_pretrained(pretrained_model_name_or_path, **kwargs)
         return cls(feature_extractor=feature_extractor, tokenizer=tokenizer)