Automated SWE - a alexngai Collection

Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

alexngai 's Collections

Latent Reasoning

Autonomous Research

Automated Research

Test-Time Compute/Optimal Scaling

Self-Improving Agents

Codegen Benchmarks

Automated SWE

updated Nov 10, 2024

CodeJudge: Evaluating Code Generation with Large Language Models

Paper • 2410.02184 • Published Oct 3, 2024

Collection guide
Browse collections

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs