HUANG SHAOHAN's picture

9 17 4

HUANG SHAOHAN

buaahsh

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Reward Reasoning Model

upvoted a paper 3 days ago

Think Only When You Need with Large Hybrid-Reasoning Models

authored a paper about 1 month ago

BitNet b1.58 2B4T Technical Report

View all activity

Organizations

buaahsh's activity

upvoted a paper 2 days ago

Reward Reasoning Model

Paper • 2505.14674 • Published 4 days ago • 30

upvoted a paper 3 days ago

Think Only When You Need with Large Hybrid-Reasoning Models

Paper • 2505.14631 • Published 4 days ago • 18

upvoted a paper 5 months ago

Multimodal Latent Language Modeling with Next-Token Diffusion

Paper • 2412.08635 • Published Dec 11, 2024 • 46

upvoted 2 papers 6 months ago

On Domain-Specific Post-Training for Multimodal Large Language Models

Paper • 2411.19930 • Published Nov 29, 2024 • 29

MH-MoE:Multi-Head Mixture-of-Experts

Paper • 2411.16205 • Published Nov 25, 2024 • 29

upvoted 2 papers 10 months ago

Multi-Head Mixture-of-Experts

Paper • 2404.15045 • Published Apr 23, 2024 • 61

E5-V: Universal Embeddings with Multimodal Large Language Models

Paper • 2407.12580 • Published Jul 17, 2024 • 41

upvoted a paper 11 months ago

Instruction Pre-Training: Language Models are Supervised Multitask Learners

Paper • 2406.14491 • Published Jun 20, 2024 • 94

upvoted a paper 12 months ago

MoRA: High-Rank Updating for Parameter-Efficient Fine-Tuning

Paper • 2405.12130 • Published May 20, 2024 • 51

upvoted 2 papers about 1 year ago

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 170

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27, 2024 • 618

upvoted 3 papers over 1 year ago

Democratizing Reasoning Ability: Tailored Learning from Large Language Model

Paper • 2310.13332 • Published Oct 20, 2023 • 16

Calibrating LLM-Based Evaluator

Paper • 2309.13308 • Published Sep 23, 2023 • 12

Adapting Large Language Models via Reading Comprehension

Paper • 2309.09530 • Published Sep 18, 2023 • 78

upvoted 3 papers almost 2 years ago

A Survey on Evaluation of Large Language Models

Paper • 2307.03109 • Published Jul 6, 2023 • 42

LongNet: Scaling Transformers to 1,000,000,000 Tokens

Paper • 2307.02486 • Published Jul 5, 2023 • 80

Kosmos-2: Grounding Multimodal Large Language Models to the World

Paper • 2306.14824 • Published Jun 26, 2023 • 34