thlinhares commited on
Commit
0c573ee
·
verified ·
1 Parent(s): 8864085

Update analyzers/ner_analyzer.py

Browse files
Files changed (1) hide show
  1. analyzers/ner_analyzer.py +3 -3
analyzers/ner_analyzer.py CHANGED
@@ -9,15 +9,15 @@ logger = logging.getLogger(__name__)
9
 
10
  class NERAnalyzer(BaseAnalyzer):
11
  def __init__(self):
12
- self.model_name = "jpbahiaz/bert-base-portuguese-ner" # Modelo NER mais leve para português
13
  logger.info(f"Carregando o modelo NER: {self.model_name}")
14
 
15
- # Carregando o modelo e tokenizer sem necessidade de token de autenticação
16
  self.model = AutoModelForTokenClassification.from_pretrained(self.model_name)
17
  self.tokenizer = AutoTokenizer.from_pretrained(self.model_name)
18
 
19
  # Definindo as labels que queremos extrair (pessoas e organizações)
20
- self.target_labels = ['B-PESSOA', 'I-PESSOA', 'B-ORGANIZACAO', 'I-ORGANIZACAO']
21
 
22
  logger.info("Modelo NER e tokenizador carregados com sucesso")
23
 
 
9
 
10
  class NERAnalyzer(BaseAnalyzer):
11
  def __init__(self):
12
+ self.model_name = "neuralmind/bert-base-portuguese-cased" # Modelo NER público para português
13
  logger.info(f"Carregando o modelo NER: {self.model_name}")
14
 
15
+ # Carregando o modelo e tokenizer
16
  self.model = AutoModelForTokenClassification.from_pretrained(self.model_name)
17
  self.tokenizer = AutoTokenizer.from_pretrained(self.model_name)
18
 
19
  # Definindo as labels que queremos extrair (pessoas e organizações)
20
+ self.target_labels = ['B-PER', 'I-PER', 'B-ORG', 'I-ORG']
21
 
22
  logger.info("Modelo NER e tokenizador carregados com sucesso")
23