GtZeng's picture

GtZeng PRO

chaoscodes

·

AI & ML interests

None yet

Recent Activity

updated a dataset 18 days ago

chaoscodes/filter_swe_smith

published a dataset 18 days ago

chaoscodes/filter_swe_smith

upvoted a paper about 1 month ago

LongWriter-Zero: Mastering Ultra-Long Text Generation via Reinforcement Learning

View all activity

Organizations

upvoted a paper about 1 month ago

LongWriter-Zero: Mastering Ultra-Long Text Generation via Reinforcement Learning

Paper • 2506.18841 • Published Jun 23 • 56

upvoted 3 papers about 2 months ago

Reinforcement Pre-Training

Paper • 2506.08007 • Published Jun 9 • 253

MiniCPM4: Ultra-Efficient LLMs on End Devices

Paper • 2506.07900 • Published Jun 9 • 88

Through the Valley: Path to Effective Long CoT Training for Small Language Models

Paper • 2506.07712 • Published Jun 9 • 18

upvoted a paper 2 months ago

Satori-SWE: Evolutionary Test-Time Scaling for Sample-Efficient Software Engineering

Paper • 2505.23604 • Published May 29 • 24

upvoted a paper 6 months ago

Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search

Paper • 2502.02508 • Published Feb 4 • 23

upvoted 2 papers about 1 year ago

RegMix: Data Mixture as Regression for Language Model Pre-training

Paper • 2407.01492 • Published Jul 1, 2024 • 41

Long Context Transfer from Language to Vision

Paper • 2406.16852 • Published Jun 24, 2024 • 34

upvoted 3 papers over 1 year ago

Sailor: Open Language Models for South-East Asia

Paper • 2404.03608 • Published Apr 4, 2024 • 21

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4, 2024 • 95

On the Generation of Medical Dialogues for COVID-19

Paper • 2005.05442 • Published May 11, 2020 • 2