Li-Wei Chen's picture

Li-Wei Chen

txya900619

·

AI & ML interests

TTS, ASR, SE

Recent Activity

updated a model 13 days ago

formospeech/whisper-large-v2-taiwanese-hakka-v1

published a model 13 days ago

formospeech/whisper-large-v2-taiwanese-hakka-v1

new activity 15 days ago

ithuan/formosan-asr-kaldi:為什麼族別選單的先後是固定的，不會亂跳

View all activity

Organizations

upvoted 3 papers 4 months ago

Why Language Models Hallucinate

Paper • 2509.04664 • Published Sep 4, 2025 • 195

EchoX: Towards Mitigating Acoustic-Semantic Gap via Echo Training for Speech-to-Speech LLMs

Paper • 2509.09174 • Published Sep 11, 2025 • 61

VibeVoice Technical Report

Paper • 2508.19205 • Published Aug 26, 2025 • 139

upvoted 11 papers 5 months ago

NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model

Paper • 2508.14444 • Published Aug 20, 2025 • 39

Representing Speech Through Autoregressive Prediction of Cochlear Tokens

Paper • 2508.11598 • Published Aug 15, 2025 • 17

DINOv3

Paper • 2508.10104 • Published Aug 13, 2025 • 291

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

Paper • 2508.02193 • Published Aug 4, 2025 • 133

ScreenCoder: Advancing Visual-to-Code Generation for Front-End Automation via Modular Multimodal Agents

Paper • 2507.22827 • Published Jul 30, 2025 • 99

Deep Researcher with Test-Time Diffusion

Paper • 2507.16075 • Published Jul 21, 2025 • 67

Group Sequence Policy Optimization

Paper • 2507.18071 • Published Jul 24, 2025 • 316

Step-Audio 2 Technical Report

Paper • 2507.16632 • Published Jul 22, 2025 • 73

OpenBEATs: A Fully Open-Source General-Purpose Audio Encoder

Paper • 2507.14129 • Published Jul 18, 2025 • 9

A Survey of Context Engineering for Large Language Models

Paper • 2507.13334 • Published Jul 17, 2025 • 259

Test-Time Scaling with Reflective Generative Model

Paper • 2507.01951 • Published Jul 2, 2025 • 107

upvoted 5 papers 6 months ago

Scaling RL to Long Videos

Paper • 2507.07966 • Published Jul 10, 2025 • 159

SingLoRA: Low Rank Adaptation Using a Single Matrix

Paper • 2507.05566 • Published Jul 8, 2025 • 113

DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation

Paper • 2506.20639 • Published Jun 25, 2025 • 30

FineWeb2: One Pipeline to Scale Them All -- Adapting Pre-Training Data Processing to Every Language

Paper • 2506.20920 • Published Jun 26, 2025 • 75

Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights

Paper • 2506.16406 • Published Jun 19, 2025 • 130

upvoted a paper 7 months ago

GenRecal: Generation after Recalibration from Large to Small Vision-Language Models

Paper • 2506.15681 • Published Jun 18, 2025 • 39