Commits · Dovakiins/qwerrwe

update outputs path so that we can mount workspace to /workspace/data (#1623)

4fde300
unverified

winglian commited on May 15, 2024

Add ORPO example and e2e test (#1572)

98c25e1
unverified

tokestermw commited on Apr 27, 2024

fix broken linting (#1541)

c10563c
unverified

winglian commited on Apr 19, 2024

Create mixtral_22.yml (#1514) [skip ci]

0eadfc8
unverified

Atlas commited on Apr 17, 2024

DBRX Model Support (#1462)

132eb74
unverified

winglian commited on Apr 12, 2024

chore(config): refactor old mistral config (#1435)

f1ebaa0
unverified

Nanobit commited on Mar 25, 2024

Train parameters exclusively in specific ranges (#1390)

05bcc9e
unverified

seungduk commited on Mar 14, 2024

FDSP + QLoRA (#1378)

9b6ee83
unverified

winglian commited on Mar 8, 2024

Mps mistral lora (#1292) [skip ci]

0f6af36
unverified

Maxime

Nanobit

winglian commited on Feb 27, 2024

fix(examples): remove is_*_derived as it's parsed automatically (#1297)

a7a9a14
unverified

Nanobit commited on Feb 21, 2024

Add seq2seq eval benchmark callback (#1274)

5a5d474
unverified

LeonardoEmili commited on Feb 13, 2024

Mixtral fixes 20240124 (#1192) [skip ci]

54d2ac1
unverified

winglian commited on Jan 24, 2024

Fine-Tuning Mistral-7b for Real-World Chatbot Applications Using Axolotl (Lora used) (#1155)

cc25039
unverified

Tilemachos Chatzipapas twenty8th

winglian commited on Jan 23, 2024

set fp16 to false if bf16, update bf16: auto in example YAMLs (#1122) [skip ci]

782b6a4
unverified

winglian

Nanobit commited on Jan 22, 2024

Set eval_sample_packing to false in mistral config.yaml (#1003)

384b817
unverified

Kevin Sydney commited on Dec 28, 2023

set output_router_logits for mixtral config: (#995)

628b754
unverified

winglian commited on Dec 22, 2023

change val size (#992)

93ebec1
unverified

mhenrichsen commited on Dec 22, 2023

Fix Deepspeed loading (#950)

5ea3aa3
unverified

winglian commited on Dec 13, 2023

new evals_per_epoch and saves_per_epoch to make things cleaner (#944)

5f79b82
unverified

winglian commited on Dec 12, 2023

Mixtral official (#942)

7fabc4d
unverified

winglian commited on Dec 12, 2023

update to latest transformers for mixstral support (#929)

35f9b0f
unverified

winglian commited on Dec 10, 2023

Mixtral multipack (#928)

68b227a
unverified

winglian commited on Dec 10, 2023

Feat(wandb): Refactor to be more flexible (#767)

a1da39c
unverified

Nanobit commited on Dec 4, 2023

feature: loss watchdog for terminating training runs that are failing (#899)

58ec8b1
unverified

kallewooof Karl-Johan Alm commited on Dec 4, 2023

don't compile deepspeed or bitsandbytes from source (#837)

f544ab2
unverified

winglian commited on Nov 9, 2023

fix eval_steps to be a sane default (#797)

8b79ff0
unverified

winglian commited on Oct 28, 2023

disable eval table w sample packing in examples (#778)

9b43e7e
unverified

winglian commited on Oct 23, 2023

simplify by removing duplicate base_model_config (#772)

2d8def6
unverified

winglian commited on Oct 23, 2023

Fix: lowercase `True` values in config (#713)

ace70b3
unverified

atgctg commited on Oct 10, 2023

Get qlora mistral-7b fine tuning working on a single 4090 (#708)

295b266
unverified

lukemarsden commited on Oct 10, 2023

fix unneeded space (#699)

f91db19
unverified

mhenrichsen commited on Oct 7, 2023

lint

83a950b
unverified

mhenrichsen commited on Oct 7, 2023

new lr, sample pack

4c8ddf2

mhenrichsen commited on Oct 6, 2023

Fix: Higher vram usage for mistral and sample_packing (#691)

669f1d0
unverified

Nanobit commited on Oct 6, 2023

Adding qlora config for Mistral (#675)

d4a88e4
unverified

Abhishek Mishra commited on Oct 6, 2023

prepared dataset caching, other misc fixes (#665)

e50a64e
unverified

winglian commited on Oct 3, 2023

Update mistral/README.md (#647)

b88f515
unverified

Adarsh Shirawalmath commited on Sep 28, 2023

Feat: Add example for Mistral (#644)

eb41f76
unverified

Nanobit commited on Sep 28, 2023