Spaces:

thlinhares
/

docling

Sleeping

thlinhares commited on Feb 23

Commit

0c573ee

verified ·

1 Parent(s): 8864085

Update analyzers/ner_analyzer.py

Files changed (1) hide show

analyzers/ner_analyzer.py CHANGED Viewed

@@ -9,15 +9,15 @@ logger = logging.getLogger(__name__)
 class NERAnalyzer(BaseAnalyzer):
     def __init__(self):
-        self.model_name = "jpbahiaz/bert-base-portuguese-ner"  # Modelo NER mais leve para português
         logger.info(f"Carregando o modelo NER: {self.model_name}")
-        # Carregando o modelo e tokenizer sem necessidade de token de autenticação
         self.model = AutoModelForTokenClassification.from_pretrained(self.model_name)
         self.tokenizer = AutoTokenizer.from_pretrained(self.model_name)
         # Definindo as labels que queremos extrair (pessoas e organizações)
-        self.target_labels = ['B-PESSOA', 'I-PESSOA', 'B-ORGANIZACAO', 'I-ORGANIZACAO']
         logger.info("Modelo NER e tokenizador carregados com sucesso")

 class NERAnalyzer(BaseAnalyzer):
     def __init__(self):
+        self.model_name = "neuralmind/bert-base-portuguese-cased"  # Modelo NER público para português
         logger.info(f"Carregando o modelo NER: {self.model_name}")
+        # Carregando o modelo e tokenizer
         self.model = AutoModelForTokenClassification.from_pretrained(self.model_name)
         self.tokenizer = AutoTokenizer.from_pretrained(self.model_name)
         # Definindo as labels que queremos extrair (pessoas e organizações)
+        self.target_labels = ['B-PER', 'I-PER', 'B-ORG', 'I-ORG']
         logger.info("Modelo NER e tokenizador carregados com sucesso")