OpenAI continua em seu caminho de guerra ‘código vermelho’ com novo modelo de geração de imagens
OpenAI está lançando um nova versão de imagens ChatGPT que promete melhor seguimento de instruções, edição mais precisa e velocidades de geração de imagens até 4x mais rápidas.
O novo modelo, batizado de GPT-Image-1.5, está disponível a partir de terça-feira para todos os usuários do ChatGPT e via API. É a mais recente escalada na competição com o Gemini do Google depois que o CEO da OpenAI, Sam Altman, declarou no mês passado um “código vermelho” em um memorando interno que vazou. O memorando detalhou os planos da OpenAI para recuperar sua posição como líder de IA depois que o Google começou a conquistar participação de mercado após o lançamento do Gemini 3, seu mais recente modelo principal, e do Nano Banana Pro, a versão mais recente do gerador de imagens virais do Google – ambos os quais lideraram o Tabela de classificação LMArena em vários benchmarks.
O Google mantém sua liderança mesmo depois que a OpenAI respondeu ao seu sucesso na semana passada com o lançamento do GPT-5.2, apresentando-o como seu modelo mais avançado até agora para desenvolvedores e uso profissional diário. A OpenAI planejava lançar um novo gerador de imagens no início de janeiro, acelerando esses planos com o anúncio desta semana. Seu último lançamento de modelo de imagem foi GPT-Image-1 em abril.
O GPT-Image-1.5 chega à medida que os geradores de imagem e vídeo avançam além dos protótipos e ganham mais recursos prontos para produção. Assim como o Nano Banana Pro, o ChatGPT Images oferece recursos de pós-produção, fornecendo controles de edição mais granulares para manter a consistência visual, como semelhança facial, iluminação, composição e tom de cor nas edições.
A maioria das ferramentas de imagem GenAI são ruins em iteração, então isso seria um grande avanço. Quando solicitados a fazer uma mudança específica, como “ajustar a expressão facial” ou “tornar a iluminação mais fria”, os modelos muitas vezes reinterpretam a imagem inteira, levando à falta de consistência.
A atualização não trata apenas de novos recursos. As imagens do ChatGPT agora também estarão acessíveis por meio de um ponto de entrada dedicado na barra lateral do ChatGPT que funciona “mais como um estúdio criativo”, disse Fidji Simo, CEO de aplicativos da OpenAI. escreveu em uma postagem no blog na terça-feira.
“As novas telas de visualização e edição de imagens facilitam a criação de imagens que correspondam à sua visão ou a inspiração em prompts de tendências e filtros predefinidos”, escreveu Simo.
Evento Techcrunch
São Francisco
|
13 a 15 de outubro de 2026
Além do novo gerador de imagens, a OpenAI está introduzindo novas maneiras de melhorar a experiência do ChatGPT com mais elementos visuais. O plano é fazer com que as consultas de pesquisa exibam mais recursos visuais com fontes claras, o que pode ser útil para tarefas como conversão de medidas ou verificação de resultados esportivos, segundo Simo.
“Ao criar, você deve ser capaz de ver e moldar o que está fazendo. Quando os recursos visuais contam uma história melhor do que apenas palavras, o ChatGPT deve incluí-los”, escreveu Simo. “Quando você precisar de uma resposta rápida ou o próximo passo estiver em outra ferramenta, ele deverá estar ali. Ao fazermos isso, podemos continuar diminuindo a distância entre o que está em sua mente e sua capacidade de dar vida a isso.”
Share this content:



Publicar comentário