Yapay Zeka ModelleriGemma 4 ile Multi-Token Prediction: Inference Hızını 2026'de 3 Katına Çıkarın | Google AI
Google AI, Gemma 4 modeli için Multi-Token Prediction (MTP) adlı yeni bir speculative decoding teknolojisi sundu: inference hızında %200 artış, kalite kaybı olmadan. Bu yenilik, AI inferans maliyetlerini kökten değiştiriyor.





















