Xinyuan Xie's picture

2 2 1

Xinyuan Xie

SatsukiVie

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

ShareGPT-4o-Image: Aligning Multimodal Models with GPT-4o-Level Image Generation

new activity about 2 months ago

SatsukiVie/FusionAudio:About the number of sample ids

authored a paper about 2 months ago

FusionAudio-1.2M: Towards Fine-grained Audio Captioning with Multimodal Contextual Fusion

View all activity

Organizations

authored a paper about 2 months ago

FusionAudio-1.2M: Towards Fine-grained Audio Captioning with Multimodal Contextual Fusion

Paper • 2506.01111 • Published Jun 1 • 30