File size: 1,993 Bytes
0848b40
e780dff
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
import gradio as gr
from sentence_transformers import SentenceTransformer, util

# Загружаем русскоязычную модель
model = SentenceTransformer("ai-forever/sbert_large_nlu_ru")

def embed_text(text):
    embedding = model.encode([text])[0]
    return str(embedding.tolist()[:10]) + " ...", len(embedding)

def compare_texts(text1, text2):
    emb1 = model.encode([text1])[0]
    emb2 = model.encode([text2])[0]
    similarity = util.cos_sim(emb1, emb2).item()
    return similarity

with gr.Blocks() as demo:
    gr.Markdown("## 🔎 Russian SBERT Embeddings Demo (ai-forever/sbert_large_nlu_ru)")

    with gr.Tab("Эмбеддинг одного текста"):
        with gr.Row():
            with gr.Column():
                input_text = gr.Textbox(label="Введите текст", placeholder="Например: Я люблю машинное обучение")
                run_btn = gr.Button("Создать эмбеддинг")
            with gr.Column():
                output_embed = gr.Textbox(label="Вектор (первые 10 значений)")
                output_dim = gr.Number(label="Размерность эмбеддинга")

        run_btn.click(embed_text, inputs=[input_text], outputs=[output_embed, output_dim])

    with gr.Tab("Сравнение двух текстов"):
        with gr.Row():
            with gr.Column():
                text1 = gr.Textbox(label="Текст 1", placeholder="Например: Я люблю машинное обучение")
                text2 = gr.Textbox(label="Текст 2", placeholder="Например: Машинное обучение — моя страсть")
                compare_btn = gr.Button("Сравнить тексты")
            with gr.Column():
                similarity_score = gr.Number(label="Косинусное сходство")

        compare_btn.click(compare_texts, inputs=[text1, text2], outputs=[similarity_score])

demo.launch()