Google lança nova versão da sua IA, Gemini 1.5

Nova abordagem permite que modelo lide com quantidades maiores de dados.

O Google disponibilizou para desenvolvedores, nesta quinta (15.fev), a nova geração do seu grande modelo de linguagem, o Gemini 1.5.

MAS JÁ? A nova versão chega cerca de dois meses após a primeira, Gemini 1.0, e uma semana depois do Gemini 1.0 Ultra, variante mais poderosa do modelo original.

A princípio, o Google liberou o Gemini 1.5 Pro, que é multimodal, de tamanho médio e otimizado para escalabilidade. Ele tem desempenho similar ao Gemini 1.0 Ultra.

O QUE MUDA? A principal novidade do Gemini 1.5 Pro é a janela de contexto maior, capaz de executar até 1 milhão de tokens — a maior do mercado.

Se soou grego, Demis Hassabis, CEO do Google Deepmind, explica o que são tokens:

A “janela de contexto” de um modelo de IA é composta de tokens, que são os blocos de construção usados ​​para processar informações. Os tokens podem ser partes inteiras ou subseções de palavras, imagens, vídeos, áudio ou código. Quanto maior a janela de contexto de um modelo, mais informações ele pode receber e processar em um determinado prompt — tornando sua saída mais consistente, relevante e útil.

Na prática, diz Demis, o Gemini 1.5 Pro é capaz de lidar com:

  • 1 hora de vídeo.
  • 11 horas de áudio.
  • Bases de códigos com +30 mil linhas.
  • 700 mil palavras.

EXEMPLOS. Para demonstrar o poder do Gemini 1.5 Pro, o Google deu alguns exemplos, como a interpretação das 402 páginas da missão Apollo 11 à Lua e os 44 minutos de um filme mudo de Buster Keaton.

“O modelo pode analisar com precisão vários pontos e eventos da trama e até mesmo raciocinar sobre pequenos detalhes do filme que podem facilmente passar despercebidos”, escreveu Demis.

TECNIQUÊS. Os ganhos do Gemini 1.5 Pro são atribuídos a uma “mudança radical” na abordagem, nas palavras do CEO do Google, Sundar Pichai.

O modelo usa uma nova arquitetura “Mixture-of-Experts” (MoE), que “aprendem a ativar seletivamente apenas as vias especializadas mais relevantes em sua rede neural” dependendo do tipo de entrada fornecida.

QUANDO? A partir desta quinta (15.fev), o Google oferece um “limited preview” do Gemini 1.5 Pro para desenvolvedores e clientes corporativos por meio do AI Studio e Vertex AI.

Desenvolvedores interessados podem se inscrever no AI Studio.

Via Blog do Google, Google Cloud e Google for Developers (em inglês).

Receba nossas newsletters e traga felicidade para sua vida.

Não perca nada: você vai receber as newsletters Garimpo (memes e atualidades), Polígono (curadoria de ciência nas redes sociais) e Prensadão (resumo semanal de tudo o que o Núcleo fez). É fácil de receber e fácil de gerenciar!
Show de bola! Verifique sua caixa de entrada e clique no link para confirmar sua inscrição.
Erro! Por favor, insira um endereço de email válido!