#inference-efficiency

JetBrains Releases Mellum2, a 12B Sparse Model for Sub-Second Inference

LLMs Jun 1, 2026

JetBrains' new Mixture-of-Experts model achieves 2x speedup over dense peers while activating just 2.5B parameters per token.

Liquid AI Releases 8B-A1B Mixture-of-Experts Model Trained on 38 Trillion Tokens

LLMs May 31, 2026

Liquid AI unveils a sparse 8-billion-parameter model with 1-billion active parameters, trained on 38T tokens—a scale comparable to frontier model training runs.