Language Models

24 tasks in this category.

24 tasks

Task ↑	Category ↕	Packages	Baselines ↕	Envs ↕	Logs
llm-algorithm-16Mqat	Language Models	llm-16m-qat-runtime	3	3	-
llm-dllm-demask-strategy	Language Models	LLaDA	3	3	✓
llm-hybrid-posttraining	Language Models	verl	4	1	-
llm-offline-rl	Language Models	LLaMA-Factory, MathRuler, alpaca_eval	2	3	✓
llm-pretrain-attention	Language Models	lm-evaluation-harness, nanoGPT	3	2	✓
llm-pretrain-bitlinear	Language Models	lm-evaluation-harness, nanoGPT	3	2	✓
llm-pretrain-embedding	Language Models	lm-evaluation-harness, nanoGPT	3	2	✓
llm-pretrain-kernel	Language Models	lm-evaluation-harness, nanoGPT	3	2	✓
llm-pretrain-linear-attention	Language Models	lm-evaluation-harness, nanoGPT	3	2	✓
llm-pretrain-loss	Language Models	lm-evaluation-harness, nanoGPT	3	2	✓
llm-pretrain-lr-schedule	Language Models	lm-evaluation-harness, nanoGPT	3	2	✓
llm-pretrain-mlp	Language Models	lm-evaluation-harness, nanoGPT	3	2	✓
llm-pretrain-normalization	Language Models	lm-evaluation-harness, nanoGPT	3	2	✓
llm-pretrain-optimizer	Language Models	lm-evaluation-harness, nanoGPT	3	2	✓
llm-pretrain-residual	Language Models	lm-evaluation-harness, nanoGPT	4	2	✓
llm-ptq-algorithm	Language Models	gptq	3	3	-
llm-qat-algorithm	Language Models	gptq	3	3	-
llm-rl-advantage	Language Models	verl	3	1	-
llm-rl-advantage-1.5b-probe	Language Models	verl	1	1	-
llm-rl-importance-sampling	Language Models	verl	3	1	-
llm-scaling-law-discovery	Language Models	scaling-law-lab	4	3	-
llm-sft-loss	Language Models	LLaMA-Factory, lm-evaluation-harness	4	2	-
llm-ttrl-reward	Language Models	ttrl	3	3	-
llm-ttt-adaptation	Language Models	nanoGPT	3	1	-