Google DeepMind veröffentlicht Gemma 4 mit 12B
Google DeepMind hat mit Gemma 4 12B ein neues offenes KI Modell veröffentlicht, das multimodale Aufgaben direkt auf herkömmlichen Laptops ausführen soll. Bild und Audiodaten fließen dabei ohne separate Encoder direkt in das Sprachmodell.
Das Modell kommt mit 16 Gigabyte Arbeitsspeicher aus und erreicht in Benchmarks nahezu die Leistung deutlich größerer Systeme. Im DocVQA Benchmark für Dokumentenfragen übertrifft die kompakte Version mit 94,9 Punkten sogar die größere 26B Variante.
Gemma 4 12B steht unter der Apache 2.0 Lizenz und ist ab sofort auf Plattformen wie Hugging Face und Kaggle verfügbar. Unterstützung gibt es auch durch Ollama, LM Studio und llama.cpp.
