5 21

Zijun

TranSirius

TranSirius

AI & ML interests

None yet

Recent Activity

upvoted a paper 6 days ago

LongWriter-Zero: Mastering Ultra-Long Text Generation via Reinforcement Learning

upvoted a paper 25 days ago

SuperWriter: Reflection-Driven Long-Form Generation with Large Language Models

upvoted a paper about 1 month ago

SageAttention3: Microscaling FP4 Attention for Inference and An Exploration of 8-Bit Training

View all activity

Organizations

upvoted a paper 6 days ago

LongWriter-Zero: Mastering Ultra-Long Text Generation via Reinforcement Learning

Paper • 2506.18841 • Published 6 days ago • 50

upvoted a paper 25 days ago

SuperWriter: Reflection-Driven Long-Form Generation with Large Language Models

Paper • 2506.04180 • Published 25 days ago • 32

upvoted 2 papers about 1 month ago

SageAttention3: Microscaling FP4 Attention for Inference and An Exploration of 8-Bit Training

Paper • 2505.11594 • Published May 16 • 72

AdaptThink: Reasoning Models Can Learn When to Think

Paper • 2505.13417 • Published May 19 • 79

upvoted a paper 2 months ago

An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes

Paper • 2504.15270 • Published Apr 21 • 10

upvoted 2 papers 4 months ago

Agentic Reward Modeling: Integrating Human Preferences with Verifiable Correctness Signals for Reliable Reward Systems

Paper • 2502.19328 • Published Feb 26 • 22

NAVIG: Natural Language-guided Analysis with Vision Language Models for Image Geo-localization

Paper • 2502.14638 • Published Feb 20 • 11

upvoted a collection 5 months ago

OpenSAE-LLaMA-3.1-8B

Collection

OpenSAE checkpoints for LLaMA 3.1 8B base model • 38 items • Updated Jan 29 • 5

upvoted a paper 5 months ago

Pairwise RM: Perform Best-of-N Sampling with Knockout Tournament

Paper • 2501.13007 • Published Jan 22 • 20

upvoted a paper 6 months ago

LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks

Paper • 2412.15204 • Published Dec 19, 2024 • 38

upvoted 3 papers 8 months ago

upvoted 2 papers 10 months ago

From MOOC to MAIC: Reshaping Online Teaching and Learning through LLM-driven Agents

Paper • 2409.03512 • Published Sep 5, 2024 • 29

LongCite: Enabling LLMs to Generate Fine-grained Citations in Long-context QA

Paper • 2409.02897 • Published Sep 4, 2024 • 48

upvoted a paper 12 months ago

Chain-of-Knowledge: Integrating Knowledge Reasoning into Large Language Models by Learning from Knowledge Graphs

Paper • 2407.00653 • Published Jun 30, 2024 • 12

upvoted 3 papers about 1 year ago

Simulating Classroom Education with LLM-Empowered Agents

Paper • 2406.19226 • Published Jun 27, 2024 • 32

Aligning Teacher with Student Preferences for Tailored Training Data Generation

Paper • 2406.19227 • Published Jun 27, 2024 • 26

SeaKR: Self-aware Knowledge Retrieval for Adaptive Retrieval Augmented Generation

Paper • 2406.19215 • Published Jun 27, 2024 • 31

upvoted a paper over 1 year ago

LongAlign: A Recipe for Long Context Alignment of Large Language Models

Paper • 2401.18058 • Published Jan 31, 2024 • 23

Zijun

AI & ML interests

Recent Activity

Organizations

TranSirius's activity