Categoria Inteligência Artificial Gemini 2.5 Pro lidera ranking de IA em codificação

Gemini 2.5 Pro lidera ranking de IA em codificação

Novo modelo de IA do Google supera rivais em benchmarks de codificação, raciocínio e testes de QI formalizados, consolidando sua posição no topo.

PorLarissa Cezar

3 min de leitura

Atualizado em 14/05/2025 às 20h43

Imagem ilustrativa: Representação artística de uma IA avançada manipulando códigos digitais.

O Gemini 2.5 Pro lidera o ranking de IA em codificação e, por outro lado, surpreende ao dominar testes formais de raciocínio. Desenvolvido pelo Google, o modelo se destaca não apenas por seu desempenho técnico, mas também pela impressionante pontuação em simulações de QI. Como se não bastasse, por ser gratuito para usuários do Gemini, o novo sistema representa um avanço notável na forma como IAs compreendem e solucionam tarefas complexas.

Gemini 2.5 Pro lidera em codificação

O modelo Gemini 2.5 Pro superou rivais como Claude na arena WebDev, uma das mais respeitadas no mundo da codificação por IA. Nesse contexto, a plataforma compara a eficácia dos principais modelos em tarefas reais de desenvolvimento. Como resultado, com uma pontuação superior, o Gemini agora ocupa a primeira colocação em desempenho técnico.

Relacionado: DNA projetado por IA controla genes com precisão

Um dos diferenciais é sua janela de contexto: são 1 milhão de tokens, com expansão planejada para 2 milhões. Com isso, o modelo consegue processar grandes bases de código — algo que, por enquanto, modelos como o ChatGPT e o Claude Sonnet ainda não conseguem fazer com tanta eficiência.

Testes de raciocínio: IA com “QI” de 115

O Gemini 2.5 Pro lidera o ranking de IA em codificação e, além disso, foi submetido a testes da Mensa Norway, organizados pela TrackingAI. Embora o conceito de “QI” em IAs seja metafórico, o modelo, ainda assim, alcançou a pontuação de 115 — acima da média humana.

Esses testes foram adaptados para refletir a capacidade da IA em resolver questões lógicas. Mesmo diante de perguntas inéditas, fora dos dados de treinamento, o Gemini, por sua vez, obteve desempenho superior em comparação a modelos como o Claude 3.7 e o GPT-4.

Relacionado: Supercomputador da Nvidia transforma Taiwan em polo de IA

Resultados em benchmarks rigorosos

No exame AIME 2025, voltado para matemática de alto nível, o Gemini alcançou 86,7% de acertos. Em ciências, por sua vez, obteve 84% na avaliação GPQA. Além disso, no exigente Humanity’s Last Exam (HLE), marcou 18,8%, superando concorrentes diretos.

Esses resultados reforçam que o Gemini 2.5 Pro lidera não apenas o ranking de IA em codificação, mas também se destaca nas áreas de raciocínio lógico e tomada de decisão.

Nova era da codificação com IA

O Gemini 2.5 Pro lidera ranking de IA em codificação e redefine os padrões de raciocínio artificial. Com resultados impressionantes em benchmarks e testes formais, a nova IA do Google mostra-se uma aliada poderosa para desenvolvedores. Se mantiver esse ritmo, o modelo poderá redefinir o conceito de inteligência computacional nos próximos anos.

Relacionado: Livre-arbítrio da IA desafia ética moderna