Lowin
/

chinese-bigbird-small-1024

Feature Extraction

Model card Files Files and versions Community

Li commited on Aug 10, 2021

Commit

35e02a7

·

1 Parent(s): 621f3fa

Update README.md

Files changed (1) hide show

README.md +0 -27

README.md CHANGED Viewed

@@ -1,55 +1,28 @@
 ---
 language:
 - zh
 license:
 - apache-2.0
 ---
 ```python
 import jieba_fast
 from transformers import BertTokenizer
 from transformers import BigBirdModel
 class JiebaTokenizer(BertTokenizer):
     def __init__(
         self, pre_tokenizer=lambda x: jieba_fast.cut(x, HMM=False), *args, **kwargs
     ):
         super().__init__(*args, **kwargs)
         self.pre_tokenizer = pre_tokenizer
     def _tokenize(self, text, *arg, **kwargs):
         split_tokens = []
         for text in self.pre_tokenizer(text):
             if text in self.vocab:
                 split_tokens.append(text)
             else:
                 split_tokens.extend(super()._tokenize(text))
         return split_tokens
 model = BigBirdModel.from_pretrained('Lowin/chinese-bigbird-small')
 tokenizer = JiebaTokenizer.from_pretrained('Lowin/chinese-bigbird-small')
 ```
 https://github.com/LowinLi/chinese-bigbird

 ---
 language:
 - zh
 license:
 - apache-2.0
 ---
 ```python
 import jieba_fast
 from transformers import BertTokenizer
 from transformers import BigBirdModel
 class JiebaTokenizer(BertTokenizer):
     def __init__(
         self, pre_tokenizer=lambda x: jieba_fast.cut(x, HMM=False), *args, **kwargs
     ):
         super().__init__(*args, **kwargs)
         self.pre_tokenizer = pre_tokenizer
     def _tokenize(self, text, *arg, **kwargs):
         split_tokens = []
         for text in self.pre_tokenizer(text):
             if text in self.vocab:
                 split_tokens.append(text)
             else:
                 split_tokens.extend(super()._tokenize(text))
         return split_tokens
 model = BigBirdModel.from_pretrained('Lowin/chinese-bigbird-small')
 tokenizer = JiebaTokenizer.from_pretrained('Lowin/chinese-bigbird-small')
 ```
 https://github.com/LowinLi/chinese-bigbird