Pular para o conteúdo

Google lança nova versão da sua IA, Gemini 1.5

Nova abordagem permite que modelo lide com quantidades maiores de dados.

Google lança nova versão da sua IA, Gemini 1.5

O Google disponibilizou para desenvolvedores, nesta quinta (15.fev), a nova geração do seu grande modelo de linguagem, o Gemini 1.5.

MAS JÁ? A nova versão chega cerca de dois meses após a primeira, Gemini 1.0, e uma semana depois do Gemini 1.0 Ultra, variante mais poderosa do modelo original.

A princípio, o Google liberou o Gemini 1.5 Pro, que é multimodal, de tamanho médio e otimizado para escalabilidade. Ele tem desempenho similar ao Gemini 1.0 Ultra.

O QUE MUDA? A principal novidade do Gemini 1.5 Pro é a janela de contexto maior, capaz de executar até 1 milhão de tokens — a maior do mercado.

Se soou grego, Demis Hassabis, CEO do Google Deepmind, explica o que são tokens:

A “janela de contexto” de um modelo de IA é composta de tokens, que são os blocos de construção usados ​​para processar informações. Os tokens podem ser partes inteiras ou subseções de palavras, imagens, vídeos, áudio ou código. Quanto maior a janela de contexto de um modelo, mais informações ele pode receber e processar em um determinado prompt — tornando sua saída mais consistente, relevante e útil.

Na prática, diz Demis, o Gemini 1.5 Pro é capaz de lidar com:

EXEMPLOS. Para demonstrar o poder do Gemini 1.5 Pro, o Google deu alguns exemplos, como a interpretação das 402 páginas da missão Apollo 11 à Lua e os 44 minutos de um filme mudo de Buster Keaton.

“O modelo pode analisar com precisão vários pontos e eventos da trama e até mesmo raciocinar sobre pequenos detalhes do filme que podem facilmente passar despercebidos”, escreveu Demis.

TECNIQUÊS. Os ganhos do Gemini 1.5 Pro são atribuídos a uma “mudança radical” na abordagem, nas palavras do CEO do Google, Sundar Pichai.

O modelo usa uma nova arquitetura “Mixture-of-Experts” (MoE), que “aprendem a ativar seletivamente apenas as vias especializadas mais relevantes em sua rede neural” dependendo do tipo de entrada fornecida.

QUANDO? A partir desta quinta (15.fev), o Google oferece um “limited preview” do Gemini 1.5 Pro para desenvolvedores e clientes corporativos por meio do AI Studio e Vertex AI.

Desenvolvedores interessados podem se inscrever no AI Studio.

Via Blog do Google, Google Cloud e Google for Developers (em inglês).

Rodrigo Ghedin

Rodrigo Ghedin

Comunicólogo e jornalista. Fundador e editor do Manual do Usuário, um blog sobre os impactos da tecnologia no nosso comportamento. Interesso-me por por tudo que nos faz humanos. Freelancer no Núcleo.

Todos os artigos

Mais em Jogo Rápido

Ver tudo

Mais de Rodrigo Ghedin

Ver tudo