Spaces:
Sleeping
Sleeping
Update analyzers/ner_analyzer.py
Browse files
analyzers/ner_analyzer.py
CHANGED
|
@@ -9,15 +9,15 @@ logger = logging.getLogger(__name__)
|
|
| 9 |
|
| 10 |
class NERAnalyzer(BaseAnalyzer):
|
| 11 |
def __init__(self):
|
| 12 |
-
self.model_name = "
|
| 13 |
logger.info(f"Carregando o modelo NER: {self.model_name}")
|
| 14 |
|
| 15 |
-
# Carregando o modelo e tokenizer
|
| 16 |
self.model = AutoModelForTokenClassification.from_pretrained(self.model_name)
|
| 17 |
self.tokenizer = AutoTokenizer.from_pretrained(self.model_name)
|
| 18 |
|
| 19 |
# Definindo as labels que queremos extrair (pessoas e organizações)
|
| 20 |
-
self.target_labels = ['B-
|
| 21 |
|
| 22 |
logger.info("Modelo NER e tokenizador carregados com sucesso")
|
| 23 |
|
|
|
|
| 9 |
|
| 10 |
class NERAnalyzer(BaseAnalyzer):
|
| 11 |
def __init__(self):
|
| 12 |
+
self.model_name = "neuralmind/bert-base-portuguese-cased" # Modelo NER público para português
|
| 13 |
logger.info(f"Carregando o modelo NER: {self.model_name}")
|
| 14 |
|
| 15 |
+
# Carregando o modelo e tokenizer
|
| 16 |
self.model = AutoModelForTokenClassification.from_pretrained(self.model_name)
|
| 17 |
self.tokenizer = AutoTokenizer.from_pretrained(self.model_name)
|
| 18 |
|
| 19 |
# Definindo as labels que queremos extrair (pessoas e organizações)
|
| 20 |
+
self.target_labels = ['B-PER', 'I-PER', 'B-ORG', 'I-ORG']
|
| 21 |
|
| 22 |
logger.info("Modelo NER e tokenizador carregados com sucesso")
|
| 23 |
|