himanshushukla12
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO-test

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

himanshushukla12's picture

himanshushukla12

End of training

d1ae942 verified 10 days ago

runs
Model save 10 days ago
.gitattributes

1.57 kB

Model save 10 days ago
README.md

2.13 kB

End of training 10 days ago
adapter_config.json

775 Bytes

Model save 10 days ago
adapter_model.safetensors

7.39 MB
LFS

Model save 10 days ago
added_tokens.json

605 Bytes

Model save 10 days ago
merges.txt

1.67 MB

Model save 10 days ago
special_tokens_map.json

616 Bytes

Model save 10 days ago
tokenizer.json

11.4 MB
LFS

Model save 10 days ago
tokenizer_config.json

7.28 kB

Model save 10 days ago
training_args.bin
Detected Pickle imports (10)
- "transformers.trainer_utils.HubStrategy",
- "torch.device",
- "transformers.training_args.OptimizerNames",
- "trl.trainer.grpo_config.GRPOConfig",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.SaveStrategy",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.SchedulerType"
How to fix it?
6.07 kB
LFS

Model save 10 days ago
vocab.json

2.78 MB

Model save 10 days ago