Xiaomi, MiMo, TileRT, inference optimization, FP4, speculative decoding, MoE, LLM inference, 2026
IA & Automatisation
Xiaomi MiMo UltraSpeed : Un modèle d’un billion de paramètres à 1 000 tokens par seconde
ALGERIATECH Editorial
juin 29, 2026
⚡ Points Clés Xiaomi MiMo-V2.5-Pro-UltraSpeed atteint plus de 1 000 tokens/s (pic à 1 200) sur un modèle MoE d’1,02...