Tanrei
/

GPTSAN-japanese

Text Generation

gptsan-japanese

text2text-generation

Model card Files Files and versions Community

Tanrei commited on Jan 23, 2023

Commit

2cb2fb1

·

1 Parent(s): 12392f9

Update README.md

Files changed (1) hide show

README.md +4 -16

README.md CHANGED Viewed

@@ -12,26 +12,14 @@ General-purpose Swich transformer based Japanese language model
 ```python
 >>> from transformers import AutoModel, AutoTokenizer
->>> model = AutoModel.from_pretrained("Tanrei/GPTSAN-japanese")
->>> tokenizer = AutoTokenizer.from_pretrained("Tanrei/GPTSAN-japanese")
->>> x_tok = tokenizer.encode("武田信玄は、")
->>> model = model.cuda()
->>> res = model.generator.generate_lm(x_tok, tokenizer)
->>> res[0]
-'勝頼の父であり、天正四年(1576)に死去するまで甲府14万石の大名として甲府を治めた戦国大名ですが...'
-```
-## Masked Language Model
-```python
->>> from transformers import AutoModel, AutoTokenizer
 >>> model = AutoModel.from_pretrained("Tanrei/GPTSAN-japanese")
 >>> tokenizer = AutoTokenizer.from_pretrained("Tanrei/GPTSAN-japanese")
->>> x_tok = tokenizer.encode("武田信玄は、<|inputmask|>時代ファンならぜひ押さえ<|inputmask|>きたい名将の一人。")
 >>> model = model.cuda()
->>> res = model.generator.predict_mlm(x_tok, tokenizer)
->>> res[0]
-'武田信玄は、戦国時代ファンならぜひ押さえておきたい名将の一人。'
 ```

 ```python
 >>> from transformers import AutoModel, AutoTokenizer
 >>> model = AutoModel.from_pretrained("Tanrei/GPTSAN-japanese")
 >>> tokenizer = AutoTokenizer.from_pretrained("Tanrei/GPTSAN-japanese")
+>>> x_tok = tokenizer.encode("武田信玄は、", return_tensors="pt")
 >>> model = model.cuda()
+>>> c = model.generate(x_tok.cuda(), max_new_tokens=50, random_seed=63)
+>>> tokenizer.decode(c[0])
+'武田信玄は、戦国の頃より「智勇兼備」した英雄として織田信長に比されてきた戦国武将であり、...'
 ```