Mercury

research Mar 31, 2026 10 min

Diffusion Language Models Explained — How Mercury Generates 1,000 Tokens Per Second

Mercury uses diffusion instead of autoregressive decoding to generate all tokens in parallel, hitting 1,000+ tokens/sec. We break down how it works.