Li Pengyi's picture

1 5

Li Pengyi

LiPengyi29

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

Listener-Rewarded Thinking in VLMs for Image Preferences

upvoted a paper 17 days ago

DreamBoothDPO: Improving Personalized Generation using Direct Preference Optimization

commented on a paper 20 days ago

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

View all activity

Organizations

upvoted a paper 3 days ago

Listener-Rewarded Thinking in VLMs for Image Preferences

Paper • 2506.22832 • Published 6 days ago • 22

upvoted a paper 17 days ago

DreamBoothDPO: Improving Personalized Generation using Direct Preference Optimization

Paper • 2505.20975 • Published May 27 • 36

commented a paper 20 days ago

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

Paper • 2506.06395 • Published 29 days ago • 125 •

commented 3 papers 21 days ago

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

Paper • 2506.06395 • Published 29 days ago • 125 •

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

Paper • 2506.06395 • Published 29 days ago • 125 •

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

Paper • 2506.06395 • Published 29 days ago • 125 •

commented a paper 22 days ago

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

Paper • 2506.06395 • Published 29 days ago • 125 •

upvoted a paper 22 days ago

Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models

Paper • 2506.06395 • Published 29 days ago • 125

upvoted 2 papers 3 months ago

MaxInfo: A Training-Free Key-Frame Selection Method Using Maximum Volume for Enhanced Video Understanding

Paper • 2502.03183 • Published Feb 5 • 3

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 119