RL/Alignment - a stereoplegic Collection

stereoplegic 's Collections

ICL

Context compression

RAG

Dataset generation

CoT

Agent

Prompt

Knowledge distillation

Coding

Dataset pruning/cleaning/dedup

Music

Math

Tabular

Writing

Science

PEFT

Continual learning

Audio

Speech

Optimal transport

Layout

Softmax

MoE

Hyena

Pruning

Weight averaging

Merging

Knowledge graph

Question answering

Memory

Multiple choice Q&A

Relationship extraction

Text classification

Semantic segmentation

Backpropagation

Concept

Modular

FFN/MLP

Positional embeddings

Federated learning

Hyperparameters

Structured data

Constrained decoding

Batched decoding

Finance

Sentiment analysis

Named Entity Recognition (NER)

Bias

Privacy

Document parsing

LLM architecture

Text editing/revision

Clarify

RoPE

Evolutionary Algorithms

Survey

Grammar

Dataset curation

Data processing

ASR

Interpretability

Data augmentation

RNN

VAE

NoPE

Hebbian

Legal

SVG

Emotion

Fashion

Mamba

Vocoder

Phrase

Analogy

SSM

Medical

Reparameterization

Literature review

Random

GNN

Similarity search

RL/Alignment

updated Jun 28