Update README.md
Browse files
README.md
CHANGED
@@ -11,16 +11,39 @@ metrics:
|
|
11 |
model-index:
|
12 |
- name: ner-portuguese
|
13 |
results: []
|
14 |
-
|
15 |
widget:
|
16 |
-
- text:
|
17 |
-
|
18 |
-
|
19 |
-
|
20 |
-
|
21 |
-
|
22 |
-
|
23 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
24 |
---
|
25 |
|
26 |
<!-- This model card has been generated automatically according to the information the Trainer had access to. You
|
@@ -28,8 +51,50 @@ should probably proofread and complete it, then remove this comment. -->
|
|
28 |
|
29 |
# ner-portuguese-br-bert-cased
|
30 |
|
31 |
-
This model aims to meet the needs of models in the Portuguese language.
|
32 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
33 |
- `O`: 0
|
34 |
- `B-ANIM`: 1
|
35 |
- `B-BIO`: 2
|
@@ -145,4 +210,4 @@ The following hyperparameters were used during training:
|
|
145 |
- Transformers 4.38.2
|
146 |
- Pytorch 2.2.1+cu121
|
147 |
- Datasets 2.18.0
|
148 |
-
- Tokenizers 0.15.2
|
|
|
11 |
model-index:
|
12 |
- name: ner-portuguese
|
13 |
results: []
|
|
|
14 |
widget:
|
15 |
+
- text: >-
|
16 |
+
Alexandre Telles foi exonerado nesta segunda-feira, assim como o secretário
|
17 |
+
nacional de Atenção Especializada à Saúde, Helvécio Magalhães. As mudanças
|
18 |
+
se deram depois de muita pressão política sobre Nísia e de reportagem do
|
19 |
+
Fantástico, da TV Globo, mostrar no domingo as condições precárias dos
|
20 |
+
hospitais na cidade.e
|
21 |
+
example_title: Exemple 1
|
22 |
+
- text: >-
|
23 |
+
Os elementos de prova colhidos corroboram as afirmações prestadas pelo
|
24 |
+
colaborador MAURO CESAR BARBOSA CID, demonstrando que, por ordem do então
|
25 |
+
Presidente JAIR BOLSONARO, MAURO CESAR CID solicitou a AILTON BARROS a
|
26 |
+
inserção dos dados falsos de vacinação contra a Covid-19 em benefício do
|
27 |
+
ex-Presidente da República e de sua filha”, afirma a PF.
|
28 |
+
example_title: Example 2
|
29 |
+
- text: >-
|
30 |
+
De acordo com a polícia, parte dos detidos foi identificado como autores de
|
31 |
+
um assalto recente a uma farmácia na região do Morumbi, na zona sul da
|
32 |
+
capital paulista. Todos já tinham passagens por outros crimes. O caso foi
|
33 |
+
registrado na 5ª delegacia da Divisão de Investigações sobre Crimes contra o
|
34 |
+
Patrimônio (DISCCPAT) como roubo e receptação, ambos qualificados, posse
|
35 |
+
ilegal de arma de fogo de uso restrito, associação criminosa e adulteração
|
36 |
+
de sinal veicular identificador.
|
37 |
+
example_title: Example 3
|
38 |
+
- text: >-
|
39 |
+
Dois legumes são suficientes para que você sinta o sabor de ambos no prato.
|
40 |
+
Um pode ser mais macio e outro mais firme, como cenoura ou abóbora. Pense em
|
41 |
+
um legume que dará saciedade e outro mais refrescante
|
42 |
+
example_title: Exemple 4
|
43 |
+
language:
|
44 |
+
- pt
|
45 |
+
library_name: transformers
|
46 |
+
pipeline_tag: token-classification
|
47 |
---
|
48 |
|
49 |
<!-- This model card has been generated automatically according to the information the Trainer had access to. You
|
|
|
51 |
|
52 |
# ner-portuguese-br-bert-cased
|
53 |
|
54 |
+
This model aims to meet the needs of models in the Portuguese language.
|
55 |
|
56 |
+
## How to use:
|
57 |
+
|
58 |
+
```python
|
59 |
+
from transformers import BertForTokenClassification, DistilBertTokenizerFast, pipeline
|
60 |
+
|
61 |
+
model = BertForTokenClassification.from_pretrained('rhaymison/ner-portuguese-br-bert-cased')
|
62 |
+
tokenizer = DistilBertTokenizerFast.from_pretrained('rhaymison/ner-portuguese-br-bert-cased'
|
63 |
+
, model_max_length=512
|
64 |
+
, do_lower_case=False
|
65 |
+
)
|
66 |
+
|
67 |
+
nlp = pipeline('ner', model=model, tokenizer=tokenizer, grouped_entities=True)
|
68 |
+
|
69 |
+
result = nlp(f"""
|
70 |
+
A passagem de uma frente fria pelo Rio Grande do Sul e Santa Catarina mantém o tempo instável,
|
71 |
+
e chove a qualquer hora nos dois estados. Há risco de temporais no sul e leste gaúcho.
|
72 |
+
No Paraná segue quente, e pancadas de chuva ocorrem a partir da tarde, também com risco de temporais.
|
73 |
+
""")
|
74 |
+
|
75 |
+
###output
|
76 |
+
|
77 |
+
[{'entity_group': 'LOC',
|
78 |
+
'score': 0.99812114,
|
79 |
+
'word': 'Rio Grande do Sul',
|
80 |
+
'start': 36,
|
81 |
+
'end': 53},
|
82 |
+
{'entity_group': 'LOC',
|
83 |
+
'score': 0.99795854,
|
84 |
+
'word': 'Santa Catarina',
|
85 |
+
'start': 56,
|
86 |
+
'end': 70},
|
87 |
+
{'entity_group': 'LOC',
|
88 |
+
'score': 0.997009,
|
89 |
+
'word': 'Paraná',
|
90 |
+
'start': 186,
|
91 |
+
'end': 192}]
|
92 |
+
|
93 |
+
```
|
94 |
+
|
95 |
+
|
96 |
+
|
97 |
+
He has various named classes. Follow the list below:
|
98 |
- `O`: 0
|
99 |
- `B-ANIM`: 1
|
100 |
- `B-BIO`: 2
|
|
|
210 |
- Transformers 4.38.2
|
211 |
- Pytorch 2.2.1+cu121
|
212 |
- Datasets 2.18.0
|
213 |
+
- Tokenizers 0.15.2
|