Bikal Basnet's picture

16 2

Bikal Basnet

bikalnetomi

·

AI & ML interests

None yet

Organizations

models 18

bikalnetomi/RLHF-PPO-PPOModel-LLama3-1B-v1.4

Text Generation • 1B • Updated Dec 2, 2024 • 15

bikalnetomi/RLHF-PPO-PPOModel-LLama3-1B-v1.3

Text Generation • 1B • Updated Dec 2, 2024 • 24

bikalnetomi/RLHF-PPO-PPOModel-LLama3-1B-v1.1

Text Generation • 1B • Updated Dec 2, 2024 • 15

bikalnetomi/RLHF-PPO-PPOModel-LLama3-1B-v1.0

Text Generation • 1B • Updated Dec 2, 2024 • 49

bikalnetomi/RLHF-PPO-RewardModel-LLama3-1B-v1

Text Classification • 1B • Updated Dec 2, 2024 • 18

bikalnetomi/RLHF-PPO-RewardModel-LLama3-1B-v2

Updated Dec 2, 2024

bikalnetomi/rlhf-ppo-llama3-1B-Reward-model-lora-bikal

Updated Dec 2, 2024

bikalnetomi/RLHF-PPO-RewardModel-LLama3-3B-v2

Text Classification • 3B • Updated Dec 2, 2024 • 14

bikalnetomi/RLHF-PPO-RewardModel-LLama3-1B-v1.1

Text Classification • 1B • Updated Dec 1, 2024 • 80

bikalnetomi/RLHF-PPO-RewardModel-LLama3-3B-v1

Text Generation • Updated Dec 1, 2024 • 12

datasets 0

None public yet