Jina AI

Team

company

Verified

https://jina.ai/

AI & ML interests

Search foundation: embeddings, rerankers, small LMs for better search

Recent Activity

hanxiao authored a paper about 2 months ago

jina-embeddings-v5-omni: Text-Geometry-Preserving Multimodal Embeddings via Frozen-Tower Composition

hanxiao submitted a paper about 2 months ago

jina-embeddings-v5-omni: Text-Geometry-Preserving Multimodal Embeddings via Frozen-Tower Composition

florian-hoenicke updated a collection about 2 months ago

jina-embeddings-v5-omni

View all activity

Papers

jina-embeddings-v5-omni: Text-Geometry-Preserving Multimodal Embeddings via Frozen-Tower Composition

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

View all Papers

jinaai 's collections 17

jina-embeddings-v5-omni

Multimodal (text + image + video + audio) embedding models aligned with jina-embeddings-v5-text-*. Two sizes, four task variants each.

jina-embeddings-v5-omni: Text-Geometry-Preserving Multimodal Embeddings via Frozen-Tower Composition

Paper • 2605.08384 • Published May 8 • 11
jinaai/jina-embeddings-v5-omni-small

Feature Extraction • 2B • Updated 16 days ago • 78.9k • 93
jinaai/jina-embeddings-v5-omni-nano

Feature Extraction • 1.0B • Updated 16 days ago • 25.3k • 33
jinaai/jina-embeddings-v5-omni-nano-text-matching

Feature Extraction • 0.9B • Updated 28 days ago • 322 • 3

jina-vlm

Jina-VLM: Small Multilingual Vision Language Model

Jina-VLM: Small Multilingual Vision Language Model

Paper • 2512.04032 • Published Dec 3, 2025 • 16
jinaai/jina-vlm

Image-Text-to-Text • 2B • Updated Apr 2 • 1.34k • 117
jinaai/jina-vlm-mlx

Image-Text-to-Text • 0.8B • Updated Dec 17, 2025 • 220 • 8

jina-code-embeddings

high quality code embeddings trained from code generation models

Efficient Code Embeddings from Code Generation Models

Paper • 2508.21290 • Published Aug 29, 2025 • 21
jinaai/jina-code-embeddings-1.5b

Feature Extraction • 2B • Updated Oct 2, 2025 • 15.1k • 49
jinaai/jina-code-embeddings-0.5b

Feature Extraction • 0.5B • Updated Oct 2, 2025 • 18.8k • 18
jinaai/jina-code-embeddings-1.5b-GGUF

2B • Updated Sep 4, 2025 • 907 • 17

jina-reranker-m0

jinaai/jina-reranker-m0

Text Classification • 2B • Updated Apr 9 • 713k • 120
jinaai/jina-reranker-m0-GGUF

2B • Updated Jul 29, 2025 • 424 • 13

JinaVDR (Visual Document Retrieval)

max. ~1000 images and OCR text included

jinaai/medical-prescriptions

Viewer • Updated Jul 4, 2025 • 100 • 11
jinaai/stanford_slide

Viewer • Updated Jul 4, 2025 • 1k • 97
jinaai/donut_vqa

Viewer • Updated Jul 4, 2025 • 800 • 7
jinaai/table-vqa

Viewer • Updated Jul 4, 2025 • 1k • 11

jina-embeddings-v3

Multilingual multi-task general text embedding model

jina-embeddings-v3: Multilingual Embeddings With Task LoRA

Paper • 2409.10173 • Published Sep 16, 2024 • 37
jinaai/jina-embeddings-v3

Feature Extraction • 0.6B • Updated Apr 8 • 2.76M • 1.15k
jinaai/jina-embeddings-v3-hf

Feature Extraction • 0.6B • Updated Apr 8 • 3.76k • 3

jina-clip

Multimodal text-image embeddings

jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images

Paper • 2412.08802 • Published Dec 11, 2024 • 7
Jina CLIP: Your CLIP Model Is Also Your Text Retriever

Paper • 2405.20204 • Published May 30, 2024 • 37
jinaai/jina-clip-v2

Feature Extraction • 0.9B • Updated Apr 8 • 179k • 338
jinaai/jina-clip-v1

Feature Extraction • 0.2B • Updated Apr 8 • 59.8k • 256

jina-embeddings-v2

The V2 family of Jina Embeddings supports encoding large documents with 8k sequence length.

Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents

Paper • 2310.19923 • Published Oct 30, 2023 • 15
Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings

Paper • 2402.17016 • Published Feb 26, 2024 • 6
jinaai/jina-embeddings-v2-base-en

Feature Extraction • 0.1B • Updated Jan 6, 2025 • 141k • 732
jinaai/jina-embeddings-v2-base-zh

Feature Extraction • 0.2B • Updated Jan 6, 2025 • 20.7k • 246

Jina Reranker v1

Neural Reranker models for English language

jinaai/jina-reranker-v1-turbo-en

Text Ranking • 37.8M • Updated Sep 10, 2025 • 49.9k • 67
jinaai/jina-reranker-v1-tiny-en

Text Ranking • 33M • Updated Sep 10, 2025 • 6.91k • 27

jina-embeddings-v5-text

Our 5th-gen embeddings: two lightweight multilingual models with SOTA performance in retrieval, matching, clustering, and classification.

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

Paper • 2602.15547 • Published Feb 17 • 31
jinaai/jina-embeddings-v5-text-small

Feature Extraction • 0.6B • Updated Apr 15 • 363k • 184
jinaai/jina-embeddings-v5-text-nano

Feature Extraction • 0.2B • Updated Apr 15 • 1,000k • 85
jinaai/jina-embeddings-v5-text-small-text-matching

Sentence Similarity • 0.6B • Updated Apr 15 • 4k • 10

jina-reranker-v3

0.6B Listwise Reranker for SOTA Multilingual Retrieval

jina-reranker-v3: Last but Not Late Interaction for Document Reranking

Paper • 2509.25085 • Published Sep 29, 2025 • 10
jinaai/jina-reranker-v3

Text Ranking • 0.6B • Updated Mar 27 • 950k • 141
jinaai/jina-reranker-v3-GGUF

Text Ranking • 0.6B • Updated Oct 4, 2025 • 1.75k • 21
jinaai/jina-reranker-v3-mlx

Text Ranking • 0.6B • Updated Oct 4, 2025 • 614 • 5

jina-embeddings-v4

Universal Embeddings for Multimodal Multilingual Retrieval

jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval

Paper • 2506.18902 • Published Jun 23, 2025 • 13
jinaai/jina-embeddings-v4

Visual Document Retrieval • 4B • Updated Apr 8 • 624k • 528
jinaai/jina-embeddings-v4-text-retrieval-GGUF

3B • Updated Sep 18, 2025 • 2.06k • 24
jinaai/jina-embeddings-v4-text-matching-GGUF

3B • Updated Sep 18, 2025 • 712 • 9

JinaVDR (Visual Document Retrieval) (BEIR)

A copy of Jina VDR in BEIR format for usage with MTEB

jinaai/medical-prescriptions_beir

Viewer • Updated Jun 24, 2025 • 300 • 147
jinaai/stanford_slide_beir

Viewer • Updated Jun 24, 2025 • 1.02k • 139
jinaai/donut_vqa_beir

Viewer • Updated Jun 24, 2025 • 2.3k • 143
jinaai/table-vqa_beir

Viewer • Updated Jun 24, 2025 • 2.38k • 145

Jina Reader-LM

Convert HTML content to LLM-friendly Markdown/JSON content

ReaderLM-v2: Small Language Model for HTML to Markdown and JSON

Paper • 2503.01151 • Published Mar 3, 2025 • 5
jinaai/ReaderLM-v2

Text Generation • 2B • Updated Mar 4, 2025 • 55.1k • • 797
jinaai/reader-lm-1.5b

Text Generation • 2B • Updated Jan 17, 2025 • 368 • • 607
jinaai/reader-lm-0.5b

Text Generation • 0.5B • Updated Jan 6, 2025 • 32 • • 150

Jina Reranker v2

A collection of state-of-the-art multilingual neural rerankers

jinaai/jina-reranker-v2-base-multilingual

Text Ranking • 0.3B • Updated Oct 21, 2025 • 1.82M • 352

late interaction retrievers

This collection list our ColBERT like late interaction retriever models

Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever

Paper • 2408.16672 • Published Aug 29, 2024 • 10
jinaai/jina-colbert-v2

0.6B • Updated Jan 17, 2025 • 158k • 145
jinaai/jina-colbert-v2-64

0.6B • Updated Jan 6, 2025 • 99 • 10
jinaai/jina-colbert-v1-en

0.1B • Updated Jan 6, 2025 • 184k • 100

jina-embeddings-v1

A novel set of high-performance sentence embedding models.

Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models

Paper • 2307.11224 • Published Jul 20, 2023 • 7
jinaai/jina-embedding-l-en-v1

Sentence Similarity • Updated Jan 6, 2025 • 463 • 25
jinaai/jina-embedding-b-en-v1

Sentence Similarity • Updated Jan 6, 2025 • 3.57k • 8
jinaai/jina-embedding-s-en-v1

Sentence Similarity • Updated Jan 6, 2025 • 720 • 26

jina-embeddings-v5-omni

Multimodal (text + image + video + audio) embedding models aligned with jina-embeddings-v5-text-*. Two sizes, four task variants each.

jina-embeddings-v5-omni: Text-Geometry-Preserving Multimodal Embeddings via Frozen-Tower Composition

Paper • 2605.08384 • Published May 8 • 11
jinaai/jina-embeddings-v5-omni-small

Feature Extraction • 2B • Updated 16 days ago • 78.9k • 93
jinaai/jina-embeddings-v5-omni-nano

Feature Extraction • 1.0B • Updated 16 days ago • 25.3k • 33
jinaai/jina-embeddings-v5-omni-nano-text-matching

Feature Extraction • 0.9B • Updated 28 days ago • 322 • 3

jina-embeddings-v5-text

Our 5th-gen embeddings: two lightweight multilingual models with SOTA performance in retrieval, matching, clustering, and classification.

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

Paper • 2602.15547 • Published Feb 17 • 31
jinaai/jina-embeddings-v5-text-small

Feature Extraction • 0.6B • Updated Apr 15 • 363k • 184
jinaai/jina-embeddings-v5-text-nano

Feature Extraction • 0.2B • Updated Apr 15 • 1,000k • 85
jinaai/jina-embeddings-v5-text-small-text-matching

Sentence Similarity • 0.6B • Updated Apr 15 • 4k • 10

jina-vlm

Jina-VLM: Small Multilingual Vision Language Model

Jina-VLM: Small Multilingual Vision Language Model

Paper • 2512.04032 • Published Dec 3, 2025 • 16
jinaai/jina-vlm

Image-Text-to-Text • 2B • Updated Apr 2 • 1.34k • 117
jinaai/jina-vlm-mlx

Image-Text-to-Text • 0.8B • Updated Dec 17, 2025 • 220 • 8

jina-reranker-v3

0.6B Listwise Reranker for SOTA Multilingual Retrieval

jina-reranker-v3: Last but Not Late Interaction for Document Reranking

Paper • 2509.25085 • Published Sep 29, 2025 • 10
jinaai/jina-reranker-v3

Text Ranking • 0.6B • Updated Mar 27 • 950k • 141
jinaai/jina-reranker-v3-GGUF

Text Ranking • 0.6B • Updated Oct 4, 2025 • 1.75k • 21
jinaai/jina-reranker-v3-mlx

Text Ranking • 0.6B • Updated Oct 4, 2025 • 614 • 5

jina-code-embeddings

high quality code embeddings trained from code generation models

Efficient Code Embeddings from Code Generation Models

Paper • 2508.21290 • Published Aug 29, 2025 • 21
jinaai/jina-code-embeddings-1.5b

Feature Extraction • 2B • Updated Oct 2, 2025 • 15.1k • 49
jinaai/jina-code-embeddings-0.5b

Feature Extraction • 0.5B • Updated Oct 2, 2025 • 18.8k • 18
jinaai/jina-code-embeddings-1.5b-GGUF

2B • Updated Sep 4, 2025 • 907 • 17

jina-embeddings-v4

Universal Embeddings for Multimodal Multilingual Retrieval

jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval

Paper • 2506.18902 • Published Jun 23, 2025 • 13
jinaai/jina-embeddings-v4

Visual Document Retrieval • 4B • Updated Apr 8 • 624k • 528
jinaai/jina-embeddings-v4-text-retrieval-GGUF

3B • Updated Sep 18, 2025 • 2.06k • 24
jinaai/jina-embeddings-v4-text-matching-GGUF

3B • Updated Sep 18, 2025 • 712 • 9

jina-reranker-m0

jinaai/jina-reranker-m0

Text Classification • 2B • Updated Apr 9 • 713k • 120
jinaai/jina-reranker-m0-GGUF

2B • Updated Jul 29, 2025 • 424 • 13

JinaVDR (Visual Document Retrieval) (BEIR)

A copy of Jina VDR in BEIR format for usage with MTEB

jinaai/medical-prescriptions_beir

Viewer • Updated Jun 24, 2025 • 300 • 147
jinaai/stanford_slide_beir

Viewer • Updated Jun 24, 2025 • 1.02k • 139
jinaai/donut_vqa_beir

Viewer • Updated Jun 24, 2025 • 2.3k • 143
jinaai/table-vqa_beir

Viewer • Updated Jun 24, 2025 • 2.38k • 145

JinaVDR (Visual Document Retrieval)

max. ~1000 images and OCR text included

jinaai/medical-prescriptions

Viewer • Updated Jul 4, 2025 • 100 • 11
jinaai/stanford_slide

Viewer • Updated Jul 4, 2025 • 1k • 97
jinaai/donut_vqa

Viewer • Updated Jul 4, 2025 • 800 • 7
jinaai/table-vqa

Viewer • Updated Jul 4, 2025 • 1k • 11

Jina Reader-LM

Convert HTML content to LLM-friendly Markdown/JSON content

ReaderLM-v2: Small Language Model for HTML to Markdown and JSON

Paper • 2503.01151 • Published Mar 3, 2025 • 5
jinaai/ReaderLM-v2

Text Generation • 2B • Updated Mar 4, 2025 • 55.1k • • 797
jinaai/reader-lm-1.5b

Text Generation • 2B • Updated Jan 17, 2025 • 368 • • 607
jinaai/reader-lm-0.5b

Text Generation • 0.5B • Updated Jan 6, 2025 • 32 • • 150

jina-embeddings-v3

Multilingual multi-task general text embedding model

jina-embeddings-v3: Multilingual Embeddings With Task LoRA

Paper • 2409.10173 • Published Sep 16, 2024 • 37
jinaai/jina-embeddings-v3

Feature Extraction • 0.6B • Updated Apr 8 • 2.76M • 1.15k
jinaai/jina-embeddings-v3-hf

Feature Extraction • 0.6B • Updated Apr 8 • 3.76k • 3

Jina Reranker v2

A collection of state-of-the-art multilingual neural rerankers

jinaai/jina-reranker-v2-base-multilingual

Text Ranking • 0.3B • Updated Oct 21, 2025 • 1.82M • 352

jina-clip

Multimodal text-image embeddings

jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images

Paper • 2412.08802 • Published Dec 11, 2024 • 7
Jina CLIP: Your CLIP Model Is Also Your Text Retriever

Paper • 2405.20204 • Published May 30, 2024 • 37
jinaai/jina-clip-v2

Feature Extraction • 0.9B • Updated Apr 8 • 179k • 338
jinaai/jina-clip-v1

Feature Extraction • 0.2B • Updated Apr 8 • 59.8k • 256

late interaction retrievers

This collection list our ColBERT like late interaction retriever models

Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever

Paper • 2408.16672 • Published Aug 29, 2024 • 10
jinaai/jina-colbert-v2

0.6B • Updated Jan 17, 2025 • 158k • 145
jinaai/jina-colbert-v2-64

0.6B • Updated Jan 6, 2025 • 99 • 10
jinaai/jina-colbert-v1-en

0.1B • Updated Jan 6, 2025 • 184k • 100

jina-embeddings-v2

The V2 family of Jina Embeddings supports encoding large documents with 8k sequence length.

Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents

Paper • 2310.19923 • Published Oct 30, 2023 • 15
Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings

Paper • 2402.17016 • Published Feb 26, 2024 • 6
jinaai/jina-embeddings-v2-base-en

Feature Extraction • 0.1B • Updated Jan 6, 2025 • 141k • 732
jinaai/jina-embeddings-v2-base-zh

Feature Extraction • 0.2B • Updated Jan 6, 2025 • 20.7k • 246

jina-embeddings-v1

A novel set of high-performance sentence embedding models.

Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models

Paper • 2307.11224 • Published Jul 20, 2023 • 7
jinaai/jina-embedding-l-en-v1

Sentence Similarity • Updated Jan 6, 2025 • 463 • 25
jinaai/jina-embedding-b-en-v1

Sentence Similarity • Updated Jan 6, 2025 • 3.57k • 8
jinaai/jina-embedding-s-en-v1

Sentence Similarity • Updated Jan 6, 2025 • 720 • 26

Jina Reranker v1

Neural Reranker models for English language

jinaai/jina-reranker-v1-turbo-en

Text Ranking • 37.8M • Updated Sep 10, 2025 • 49.9k • 67
jinaai/jina-reranker-v1-tiny-en

Text Ranking • 33M • Updated Sep 10, 2025 • 6.91k • 27

AI & ML interests

Recent Activity

Papers

Team members 23

jinaai 's collections 17