ajibawa-2023
/

Code-Jamba-v0.1

Text Generation

Inference Endpoints

Model card Files Files and versions Community

ajibawa-2023 commited on Apr 12

Commit

46063d0

•

1 Parent(s): d2e41f3

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -19,13 +19,13 @@ tags:
 **Code-Jamba-v0.1**
 This model is trained upon my dataset [Code-290k-ShareGPT](https://huggingface.co/datasets/ajibawa-2023/Code-290k-ShareGPT) and [Code-Feedback](https://huggingface.co/datasets/m-a-p/Code-Feedback). It is finetuned on Jamba-v0.1 .
-This model is very very good in Code generation is various languages such as Python, Java, JavaScript, GO, C++, Rust, Ruby, Sql, MySql, R, Julia, Haskell, etc..
 This model will also generate detailed explanation/logic behind each code.
 This model uses ChatML prompt format.
 **Training**
-Entire dataset was trained on 2 x H100 94GB. For 3 epoch, training took 162 hours. Axolotl along with DeepSpeed codebase was used for training purpose. This was trained on Jamba-v0.1 by AI21Labs.
 This is a qlora model. Links for quantized models will be updated very soon.

 **Code-Jamba-v0.1**
 This model is trained upon my dataset [Code-290k-ShareGPT](https://huggingface.co/datasets/ajibawa-2023/Code-290k-ShareGPT) and [Code-Feedback](https://huggingface.co/datasets/m-a-p/Code-Feedback). It is finetuned on Jamba-v0.1 .
+It is very very good in Code generation in various languages such as **Python, Java, JavaScript, GO, C++, Rust, Ruby, Sql, MySql, R, Julia, Haskell**, etc..
 This model will also generate detailed explanation/logic behind each code.
 This model uses ChatML prompt format.
 **Training**
+Entire dataset was trained on **2 x H100** 94GB. For 3 epoch, training took **162 hours**. Axolotl along with DeepSpeed codebase was used for training purpose. This was trained on Jamba-v0.1 by AI21Labs.
 This is a qlora model. Links for quantized models will be updated very soon.