O Google disponibilizou para desenvolvedores, nesta quinta (15.fev), a nova geração do seu grande modelo de linguagem, o Gemini 1.5.
MAS JÁ? A nova versão chega cerca de dois meses após a primeira, Gemini 1.0, e uma semana depois do Gemini 1.0 Ultra, variante mais poderosa do modelo original.
A princípio, o Google liberou o Gemini 1.5 Pro, que é multimodal, de tamanho médio e otimizado para escalabilidade. Ele tem desempenho similar ao Gemini 1.0 Ultra.
O QUE MUDA? A principal novidade do Gemini 1.5 Pro é a janela de contexto maior, capaz de executar até 1 milhão de tokens — a maior do mercado.
Se soou grego, Demis Hassabis, CEO do Google Deepmind, explica o que são tokens:
A “janela de contexto” de um modelo de IA é composta de tokens, que são os blocos de construção usados para processar informações. Os tokens podem ser partes inteiras ou subseções de palavras, imagens, vídeos, áudio ou código. Quanto maior a janela de contexto de um modelo, mais informações ele pode receber e processar em um determinado prompt — tornando sua saída mais consistente, relevante e útil.
Na prática, diz Demis, o Gemini 1.5 Pro é capaz de lidar com:
- 1 hora de vídeo.
- 11 horas de áudio.
- Bases de códigos com +30 mil linhas.
- 700 mil palavras.
EXEMPLOS. Para demonstrar o poder do Gemini 1.5 Pro, o Google deu alguns exemplos, como a interpretação das 402 páginas da missão Apollo 11 à Lua e os 44 minutos de um filme mudo de Buster Keaton.
“O modelo pode analisar com precisão vários pontos e eventos da trama e até mesmo raciocinar sobre pequenos detalhes do filme que podem facilmente passar despercebidos”, escreveu Demis.
TECNIQUÊS. Os ganhos do Gemini 1.5 Pro são atribuídos a uma “mudança radical” na abordagem, nas palavras do CEO do Google, Sundar Pichai.
O modelo usa uma nova arquitetura “Mixture-of-Experts” (MoE), que “aprendem a ativar seletivamente apenas as vias especializadas mais relevantes em sua rede neural” dependendo do tipo de entrada fornecida.
QUANDO? A partir desta quinta (15.fev), o Google oferece um “limited preview” do Gemini 1.5 Pro para desenvolvedores e clientes corporativos por meio do AI Studio e Vertex AI.
Desenvolvedores interessados podem se inscrever no AI Studio.
Via Blog do Google, Google Cloud e Google for Developers (em inglês).