Update README.md
Browse files
README.md
CHANGED
@@ -38,14 +38,14 @@ License: Apache-2.0
|
|
38 |
|
39 |
This model is designed for efficient and accurate function-level code retrieval across multiple programming languages, extending ModernBERT for code intelligence tasks.
|
40 |
|
41 |
-
|
42 |
|
43 |
---
|
44 |
|
45 |
## 🌟 特徴 / Key Features
|
46 |
|
47 |
* 対応言語:Python, Java, JavaScript, PHP, Ruby, Go, Rust
|
48 |
-
*
|
49 |
* 重複除去済みの高品質データセットを使用(CodeSearchNet の test split 除外済)
|
50 |
* `CodeModernBERT-Crow-Pre` から継続学習により高性能を実現
|
51 |
* 最大 8192 トークンの入力長に対応(学習時は 2048 トークンで調整)
|
|
|
38 |
|
39 |
This model is designed for efficient and accurate function-level code retrieval across multiple programming languages, extending ModernBERT for code intelligence tasks.
|
40 |
|
41 |
+
本モデルは、収集・整備した多言語コードデータセットを用いて **ゼロからの事前学習**を行っています
|
42 |
|
43 |
---
|
44 |
|
45 |
## 🌟 特徴 / Key Features
|
46 |
|
47 |
* 対応言語:Python, Java, JavaScript, PHP, Ruby, Go, Rust
|
48 |
+
* **ゼロからの事前学習(ModernBERTアーキテクチャに基づく)**
|
49 |
* 重複除去済みの高品質データセットを使用(CodeSearchNet の test split 除外済)
|
50 |
* `CodeModernBERT-Crow-Pre` から継続学習により高性能を実現
|
51 |
* 最大 8192 トークンの入力長に対応(学習時は 2048 トークンで調整)
|