Commits · flax-community/dalle-mini

Merge branch 'main' of https://github.com/borisdayma/dalle-mini into main

0a691de

boris commited on Feb 2, 2022

feat: log num_parameters early

7cfe576

boris commited on Feb 2, 2022

fix: distributed shampoo class

696422e

boris commited on Feb 2, 2022

feat: update distributed_shampoo

5996680

boris commited on Feb 2, 2022

feat(modeling): simplify abstract_init

fa72aa7

boris commited on Feb 2, 2022

feat(train) - handle multiple nodes (#130)

0952927
unverified

boris commited on Feb 1, 2022

feat: handle model parallel

1bb3269

boris commited on Feb 1, 2022

feat(train): more custom x-axis

5f28cd2

boris commited on Jan 31, 2022

feat(train): split artifact into model/state (#128)

7c4c287
unverified

boris commited on Jan 30, 2022

fix: style

386f839

boris commited on Jan 30, 2022

fix(train): opt_state_shape for distributed_shampoo

225b6ff

boris commited on Jan 29, 2022

feat(train): split artifact into model/state

fa5b058

boris commited on Jan 27, 2022

style(tokenizer): remove unused variables

605df32

boris commited on Jan 27, 2022

feat: use fast tokenizer

767d78a

boris commited on Jan 27, 2022

feat(train): another 25% faster

14abe8c

boris commited on Jan 26, 2022

Merge pull request #127 from borisdayma/pjit-t5x

e4401dd
unverified

boris commited on Jan 26, 2022

feat(train): overhead from 70% to 1% 🥳

2b7f5f1

boris commited on Jan 26, 2022

feat(pjit): follow t5x style

7b5868f

boris commited on Jan 26, 2022

fix(train): grads spec

00710bc

boris commited on Jan 25, 2022

feat(train): improve pjit speed

f254058

boris commited on Jan 25, 2022

fix(train): consider correct batch size

b7c7458

boris commited on Jan 25, 2022

feat(train): custom start_preconditioning_step

8149924

boris commited on Jan 24, 2022

feat(train): handle distributed_shampoo in pjit

032f623

boris commited on Jan 24, 2022

feat: update distributed_shampoo + fix None spec

8a9e367

boris commited on Jan 24, 2022

feat(train): distributed_shampoo with pjit

cc34d07

boris commited on Jan 24, 2022

feat(train): use pjit (#125)

f5239e1
unverified

boris commited on Jan 23, 2022

style: unsused import

7a176b9

boris commited on Jan 23, 2022

fix style

f044cb8

boris commited on Jan 23, 2022