Google lança Gemini 3 Flash, torna-o o modelo padrão no aplicativo Gemini

Gemini 3 Flash blog header

Google lança Gemini 3 Flash, torna-o o modelo padrão no aplicativo Gemini

O Google lançou hoje seu modelo Gemini 3 Flash rápido e barato, baseado no Gemini 3 lançado no mês passado, buscando roubar o trovão do OpenAI. A empresa também está tornando este o modelo padrão no aplicativo Gemini e no modo AI na pesquisa.

O novo modelo Flash chega seis meses depois que o Google anunciou o modelo Gemini 2.5 Flash, oferecendo melhorias significativas. No benchmark, o modelo Gemini 3 Flash supera seu antecessor por uma margem significativa e iguala o desempenho de outros modelos de ponta, como Gemini 3 Pro e GPT 5.2, em algumas medidas.

Por exemplo, obteve 33,7% sem uso de ferramentas em Referência do último exame da humanidade, que é projetado para testar conhecimentos em diferentes domínios. Em comparação, o Gemini 3 Pro obteve 37,5%, o Gemini 2.5 Flash obteve 11% e o recém-lançado GPT-5.2 obteve 34,5%.

No benchmark de multimodalidade e raciocínio MMMU-Pro, o novo modelo superou todos os concorrentes com uma pontuação de 81,2%.

Lançamento para o consumidor

O Google está tornando o Gemini 3 Flash o modelo padrão no aplicativo Gemini globalmente, substituindo o Gemini 2.5 Flash. Os usuários ainda podem escolher o modelo Pro no seletor de modelos para questões de matemática e codificação.

A empresa afirma que o novo modelo é bom para identificar conteúdo multimodal e dar uma resposta com base nisso. Por exemplo, você pode enviar seu pequeno vídeo de pickleball e pedir dicas; você pode tentar desenhar um esboço e fazer com que o modelo adivinhe o que você está desenhando; ou você pode fazer upload de uma gravação de áudio para obter análise ou gerar um questionário.

A empresa afirmou ainda que o modelo entende melhor a intenção das consultas dos usuários e pode gerar respostas mais visuais com elementos como imagens e tabelas.

Evento Techcrunch

São Francisco
|
13 a 15 de outubro de 2026

Você também pode usar o novo modelo para criar protótipos de aplicativos no aplicativo Gemini usando prompts.

O Gemini 3 Pro agora está disponível para pesquisa para todos nos EUA e mais pessoas nos EUA também podem acessar o modelo de imagem Nano Banana Pro na pesquisa.

Disponibilidade para empresas e desenvolvedores

O Google observou que empresas como JetBrains, Figma, Cursor, Harvey e Latitude já estão usando o modelo Gemini 3 Flash, que está disponível através da Vertex AI e Gemini Enterprise.

Para os desenvolvedores, a empresa está disponibilizando o modelo em versão prévia por meio da API e no Antigravity, nova ferramenta de codificação do Google lançada no mês passado.

A empresa disse que o Gemini 3 Pro obteve pontuação de 78% no benchmark de codificação verificado pelo SWE-bench, superado apenas pelo GPT-5.2. Acrescentou que o modelo é ideal para análise de vídeo, extração de dados e perguntas e respostas visuais e, devido à sua velocidade, é adequado para fluxos de trabalho rápidos e repetíveis.

Créditos da imagem:Google

O preço do modelo é de US$ 0,50 por 1 milhão de tokens de entrada e US$ 3,00 por 1 milhão de tokens de saída. Isso é um pouco mais caro do que US$ 0,30 por 1 milhão de tokens de entrada e US$ 2,50 por 1 milhão de tokens de saída do Gemini Flash 2.5. Mas o Google afirma que o novo modelo supera o modelo Gemini 2.5 Pro e é três vezes mais rápido. E, para tarefas de raciocínio, ele usa em média 30% menos tokens do que o 2.5 Pro. Isso significa que, de modo geral, você pode economizar no número de tokens para determinadas tarefas.

gemini-3-flash-token-efficiency Google lança Gemini 3 Flash, torna-o o modelo padrão no aplicativo Gemini
Créditos da imagem:Google

“Nós realmente posicionamos o flash como mais um modelo robusto. Então, se você olhar, por exemplo, até mesmo os preços de entrada e saída no topo desta tabela, o Flash é apenas uma oferta muito mais barata do ponto de vista do preço de entrada e saída. E assim, na verdade, permite, para muitas empresas, tarefas em massa”, disse Tulsee Doshi, diretor sênior e chefe de produto da Gemini Models, ao TechCrunch em um briefing.

Desde que lançou o Gemini 3, o Google processou mais de 1 trilhão de tokens por dia em sua API, em meio ao seu lançamento feroz e à guerra de desempenho com o OpenAI.

No início deste mês, Sam Altman teria enviado um “Código Vermelho” interno memorando para a equipe OpenAI após O tráfego do ChatGPT caiu à medida que a participação de mercado do Google nos consumidores aumentava. Poste isso, a OpenAI lançou o GPT-5.2 e um novo modelo de geração de imagens. A OpenAI também se vangloriou de seu crescente uso empresarial e disse que o volume de mensagens ChatGPT cresceu 8x desde novembro de 2024.

Embora o Google não tenha abordado diretamente a concorrência com OpenAI, disse que o lançamento de novos modelos está desafiando todas as empresas a serem ativas.

“O que está acontecendo em toda a indústria é como se todos esses modelos continuassem a ser incríveis, desafiando uns aos outros, ultrapassando fronteiras. E acho que o que também é incrível é que as empresas estão lançando esses modelos”, disse Doshi.

“Também estamos introduzindo novos benchmarks e novas formas de avaliar esses modelos. E isso também nos encoraja.”

Share this content:

Publicar comentário