Nishant Balepur's picture

Nishant Balepur

nbalepur

·

https://nbalepur.github.io/

AI & ML interests

NLP

Organizations

Collections 2

Papers 7

arxiv:2502.14127

arxiv:2406.06608

arxiv:2402.12483

arxiv:2402.12291

models 8

nbalepur/Llama-3.1-8B-PT-DPO-HHH

Updated Dec 14, 2024

nbalepur/Llama-3.1-8B-PT-DPO-Mnemonic

Updated Dec 14, 2024

nbalepur/Llama-3.1-8B-PT-DPO-BeaverTails

Text Generation • 8B • Updated Dec 14, 2024 • 6

nbalepur/Llama-3.1-8B_copy_persona_False_Mnemonic_dpo_chosen

Text Generation • 8B • Updated Nov 10, 2024 • 4

nbalepur/Llama-3.1-8B_copy_persona_False_Safe_RLHF_dpo_chosen

Text Generation • 8B • Updated Nov 10, 2024 • 3

nbalepur/LLama-2-70b-Mnemonic-Tokenizer

Updated May 11, 2024

nbalepur/LLama-2-70b-Mnemonic-SFT

Text Generation • 69B • Updated May 10, 2024 • 17 • 1

nbalepur/LLama-2-70b-Mnemonic-DPO

Text Generation • 69B • Updated May 10, 2024 • 20

datasets 100

nbalepur/deep-research-actions

Viewer • Updated Nov 10, 2025 • 21.4k • 1.46k

nbalepur/mcqa-bench-base

Viewer • Updated Oct 10, 2025 • 12.3k • 8

nbalepur/cheating-reasoners-mcqa-large

Viewer • Updated Aug 31, 2025 • 7.44k • 3

nbalepur/google-query-wellformedness

Viewer • Updated May 28, 2025 • 25.1k • 13

nbalepur/cheating-reasoners

Viewer • Updated May 10, 2025 • 9.39k • 6

nbalepur/Planorama-user-data

Viewer • Updated Apr 21, 2025 • 300 • 4

nbalepur/planorama_without_label_swap_fixed2

Viewer • Updated Apr 21, 2025 • 300 • 4

nbalepur/planorama_irt_swap_newslope

Viewer • Updated Apr 20, 2025 • 300 • 3

nbalepur/planorama_without_label_swap_fixed

Viewer • Updated Apr 20, 2025 • 300 • 6

nbalepur/planorama_irt_swap2

Viewer • Updated Apr 16, 2025 • 300 • 75

View 100 datasets