Preconditioning

Your weight: normal

0.

PC Layer: Polynomial Weight Preconditioning for Improving LLM Pre-Training (arxiv.org)

0 points 1 sources 1 minutes ago cluster

Researchers propose a preconditioning layer that uses polynomial preconditioning to ensure stable weight conditioning throughout large language model (LLM) training, improving pre-training performance.

large-language-models machine-learning preconditioning