3 4 4

Yuta Oshima

shim0114

https://shim0114.github.io/

AI & ML interests

Generative Models, Video Generation, World Models, AI Alignment

Recent Activity

liked a model 9 days ago

EQUES/qwen-image-edit-2509-lineart-interpolation

liked a dataset 11 days ago

kevinLian/LoopNav

upvoted a paper 23 days ago

SSM Meets Video Diffusion Models: Efficient Video Generation with Structured State Spaces

View all activity

Organizations

None yet

liked a model 9 days ago

EQUES/qwen-image-edit-2509-lineart-interpolation

Updated 15 days ago • 12

liked a dataset 11 days ago

kevinLian/LoopNav

Viewer • Updated Sep 23 • 19.2k • 1.33k • 3

upvoted a paper 23 days ago

SSM Meets Video Diffusion Models: Efficient Video Generation with Structured State Spaces

Paper • 2403.07711 • Published Mar 12, 2024 • 1

New activity in kohsei/MultiBanana-Benchmark 23 days ago

Update README.md

#3 opened 23 days ago by

shim0114

liked a model 24 days ago

ramu0e/minisora-dmlab

Text-to-Video • Updated 25 days ago • 2

upvoted a paper 24 days ago

MultiBanana: A Challenging Benchmark for Multi-Reference Text-to-Image Generation

Paper • 2511.22989 • Published 29 days ago • 15

commented a paper 24 days ago

MultiBanana: A Challenging Benchmark for Multi-Reference Text-to-Image Generation

Paper • 2511.22989 • Published 29 days ago • 15 •

upvoted 2 papers 24 days ago

ADOPT: Modified Adam Can Converge with Any β_2 with the Optimal Rate

Paper • 2411.02853 • Published Nov 5, 2024 • 1

Inference-Time Text-to-Video Alignment with Diffusion Latent Beam Search

Paper • 2501.19252 • Published Jan 31 • 1

authored 4 papers 26 days ago

SSM Meets Video Diffusion Models: Efficient Video Generation with Structured State Spaces

Paper • 2403.07711 • Published Mar 12, 2024 • 1

ADOPT: Modified Adam Can Converge with Any $β_2$ with the Optimal Rate

Paper • 2411.02853 • Published Nov 5, 2024 • 1

MultiBanana: A Challenging Benchmark for Multi-Reference Text-to-Image Generation

Paper • 2511.22989 • Published 29 days ago • 15

Inference-Time Text-to-Video Alignment with Diffusion Latent Beam Search

Paper • 2501.19252 • Published Jan 31 • 1

New activity in kohsei/MultiBanana-Benchmark 26 days ago

Update README.md

#2 opened 26 days ago by

shim0114

liked a dataset 29 days ago

kohsei/MultiBanana-Benchmark

Viewer • Updated 23 days ago • 4.9k • 997 • 2

Yuta Oshima

AI & ML interests

Recent Activity

Organizations

shim0114's activity

Update README.md

Update README.md