3 1 33

Vaidik

VaidikML0508

AI & ML interests

exploring another way to use gradient decent

Recent Activity

liked a model about 2 months ago

bharatgenai/Param2-17B-A2.4B-Thinking

liked a model about 2 months ago

sarvamai/sarvam-105b

liked a model 5 months ago

maya-research/maya1

View all activity

Organizations

None yet

Collections 2

models 14

datasets 2

VaidikML0508/SharkTank-Offer-V1

Viewer • Updated Mar 18, 2025 • 255 • 13

VaidikML0508/SharkTank-Offer-DPO-dataset-V1

Viewer • Updated Mar 18, 2025 • 263 • 7 • 1

Vaidik

AI & ML interests

Recent Activity

Organizations

Collections 2

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-GRPO-16bits-V1

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-SFT-DPO-4bits-V1

VaidikML0508/SharkTank-Offer-V1

VaidikML0508/SharkTank-Offer-DPO-dataset-V1

Self-GRIT/PILE_Wikipedia_Pretraining_subset_100k-distill

SharedBailii/bailii-pretraining-order

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-GRPO-16bits-V1

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-SFT-DPO-4bits-V1

VaidikML0508/SharkTank-Offer-V1

VaidikML0508/SharkTank-Offer-DPO-dataset-V1

Self-GRIT/PILE_Wikipedia_Pretraining_subset_100k-distill

SharedBailii/bailii-pretraining-order

models 14

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-GRPO-16bits-V1

VaidikML0508/Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-SFT-DPO-4bits-V1

VaidikML0508/rl_course_vizdoom_health_gathering_supreme

VaidikML0508/Reinforce-pixel-copte-1

VaidikML0508/Reinforce-pixel-copter

VaidikML0508/ML-Agents-Pyramids

VaidikML0508/ppo-LunarLander-v2

VaidikML0508/taxi-V3

VaidikML0508/q-FrozenLake-v1-4x4-noSlippery

VaidikML0508/ppo-SnowballTarget

datasets 2

VaidikML0508/SharkTank-Offer-V1

VaidikML0508/SharkTank-Offer-DPO-dataset-V1

Vaidik

AI & ML interests

Recent Activity

Organizations

Collections 2

models 14 Sort: Recently updated

datasets 2 Sort: Recently updated

models 14

datasets 2