File size: 906 Bytes
73164d2
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
---
license: mit
language:
- ko
base_model:
- klue/bert-base
---
# ๐ŸŠ SapBERT-Ko-EN

- ํ•œ๊ตญ์–ด ๋ชจ๋ธ์„ ์ด์šฉํ•œ **SapBERT**(Self-alignment pretraining for BERT)์ž…๋‹ˆ๋‹ค.
- ํ•œยท์˜ ์˜๋ฃŒ ์šฉ์–ด ์‚ฌ์ „์ธ KOSTOM์„ ์‚ฌ์šฉํ•ด ํ•œ๊ตญ์–ด ์šฉ์–ด์™€ ์˜์–ด ์šฉ์–ด๋ฅผ ์ •๋ ฌํ–ˆ์Šต๋‹ˆ๋‹ค.
- ์ฐธ๊ณ : [SapBERT](https://aclanthology.org/2021.naacl-main.334.pdf), [Original Code](https://github.com/cambridgeltl/sapbert)

## 1. SapBERT-KO-EN
- **SapBERT**๋Š” ์ˆ˜๋งŽ์€ ์˜๋ฃŒ ๋™์˜์–ด๋ฅผ ๋™์ผํ•œ ์˜๋ฏธ๋กœ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•œ ์‚ฌ์ „ ํ•™์Šต ๋ฐฉ๋ฒ•๋ก ์ž…๋‹ˆ๋‹ค.
- Multi-Similarity Loss๋ฅผ ์ด์šฉํ•ด ๋™์ผํ•œ ์˜๋ฃŒ ์ฝ”๋“œ๋ฅผ ์ง€๋‹Œ ์šฉ์–ด ๊ฐ„์˜ ์œ ์‚ฌ๋„๋ฅผ ํ‚ค์šฐ๋Š” ๋ฐฉ์‹์œผ๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.
- **SapBERT-KO-EN**๋Š” ํ•œยท์˜ ํ˜ผ์šฉ์ฒด๋กœ ์ด๋ฃจ์–ด์ง„ ํ•œ๊ตญ ์˜๋ฃŒ ๊ธฐ๋ก์„ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด ํ•œยท์˜ ์˜๋ฃŒ ์šฉ์–ด๋ฅผ ์ •๋ ฌํ•œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.


[Github](https://github.com/snumin44/SapBERT-KO-EN)