Google ha aggiornato i risultati di Android Bench, il benchmark dedicato allo sviluppo di app Android, includendo per la prima volta il nuovo modello AI Gemini 3.5 Flash. Il risultato è sorprendente: non solo il modello non entra nel podio, ma viene superato dal suo predecessore Gemini 3.1 Pro Preview — e costa significativamente di più.

La classifica di Android Bench: GPT 5.5 in cima, Gemini 3.5 Flash al sesto posto

La classifica attuale vede al primo posto GPT 5.5 di OpenAI con 74 punti, seguito da GPT 5.4 e Gemini 3.1 Pro Preview entrambi a 72,4 punti, e poi i modelli Claude Opus di Anthropic. Gemini 3.5 Flash si ferma al sesto posto con 63,7 punti. Considerando che Google l’aveva presentato al Google I/O 2026 come “il più potente modello Flash di sempre”, capace di superare persino Gemini 3.1 Pro su alcuni benchmark interni, la performance su Android Bench rappresenta una doccia fredda.

Il problema dei costi: 147 dollari per esecuzione

L’aspetto che ha suscitato più scalpore tra gli sviluppatori è quello economico. Gemini 3.5 Flash ha consumato in media 355,9 token per esecuzione, traducendosi in un costo medio di circa 147 dollari a chiamata — il più alto dell’intera classifica. Il confronto con Gemini 3.1 Pro Preview, che costa circa un terzo e ottiene un punteggio nettamente superiore, è impietoso. Il brand “Flash” è da sempre associato a velocità e risparmio economico: su entrambi i fronti, il nuovo modello sembra deludere in questo specifico contesto.

Un benchmark specifico, non un giudizio definitivo

È giusto contestualizzare: Android Bench misura le capacità di sviluppo di app Android, un dominio molto specifico. Gemini 3.5 Flash potrebbe eccellere in altri compiti — Google cita le sue capacità multimodali, la velocità di risposta (fino a 4 volte più rapido dei competitor) e l’adattamento ai workflow complessi. Tuttavia, per gli sviluppatori Android che stanno valutando quale modello AI integrare nei propri strumenti, i dati di questo benchmark sono rilevanti e suggeriscono di considerare anche Gemini 3.1 Pro Preview come alternativa più efficiente.