Yang Yang's picture

19

Yang Yang

yangyang14641

·

yangyang14641

AI & ML interests

None yet

Organizations

None yet

liked a model 7 months ago

mistralai/Mistral-Small-3.2-24B-Instruct-2506

24B • Updated 20 days ago • 154k • 541

liked a Space 10 months ago

The Ultra-Scale Playbook

The ultimate guide to training LLM on large GPU Clusters

liked 2 models 12 months ago

deepseek-ai/DeepSeek-R1

Text Generation • 685B • Updated Mar 27, 2025 • 379k • • 12.9k

hexgrad/Kokoro-82M

Text-to-Speech • Updated Apr 10, 2025 • 1.73M • • 5.54k

liked 15 models about 1 year ago

deepseek-ai/DeepSeek-Coder-V2-Instruct

Text Generation • 236B • Updated Aug 21, 2024 • 44k • 674

deepseek-ai/DeepSeek-Coder-V2-Lite-Base

Text Generation • 16B • Updated Jul 3, 2024 • 18.4k • 100

deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct

Text Generation • 16B • Updated Jul 3, 2024 • 158k • • 521

deepseek-ai/DeepSeek-Coder-V2-Base

Text Generation • 236B • Updated Jul 3, 2024 • 43.2k • 81

deepseek-ai/DeepSeek-V3

Text Generation • 685B • Updated Mar 27, 2025 • 784k • • 4.01k

deepseek-ai/DeepSeek-V3-Base

685B • Updated Mar 27, 2025 • 19.8k • 1.68k

nvidia/OpenMath2-Llama3.1-70B

Text Generation • 71B • Updated Nov 25, 2024 • 546 • 21

nvidia/OpenMath2-Llama3.1-8B

Text Generation • 8B • Updated Nov 25, 2024 • 676 • • 32

nvidia/OpenMath2-Llama3.1-70B-nemo

Updated Nov 25, 2024 • 9

nvidia/OpenMath2-Llama3.1-8B-nemo

Updated Nov 25, 2024 • 6

TheBloke/Llama-2-7B-Chat-GGUF

Text Generation • 7B • Updated Oct 14, 2023 • 129k • 506

nvidia/Llama-3.1-Nemotron-70B-Instruct-HF

Text Generation • 71B • Updated Apr 13, 2025 • 4.28k • • 2.06k

foduucom/stockmarket-pattern-detection-yolov8

Object Detection • Updated Apr 2, 2025 • 6.31k • 388

meta-llama/Llama-3.3-70B-Instruct

Text Generation • 71B • Updated Dec 21, 2024 • 322k • • 2.62k

openai/whisper-large-v3-turbo

Automatic Speech Recognition • 0.8B • Updated Oct 4, 2024 • 2.55M • • 2.77k