Google lança Gemma 4 e novos recursos no Vids
Gemma 4 foi liberado para a comunidade de código aberto; agora, Vids permite controle de avatares 2D e 3D via comandos de texto

O Google apresentou a nova linha de modelos de código aberto Gemma 4, levando para a comunidade tecnologias que antes eram usadas apenas em seus modelos proprietários, como o Gemini 3 Pro. Essa nova geração chega com quatro versões diferentes, cada uma variando na quantidade de parâmetros, o que impacta diretamente no desempenho e na capacidade de processamento.
Diversidade de modelos e capacidade de processamento do Gemma 4
- Para dispositivos de borda, como smartphones, o Google disponibiliza os modelos “Effective” com dois bilhões e quatro bilhões de parâmetros;
- Para máquinas mais potentes, as opções são os sistemas “Mixture of Experts” com 26 bilhões de parâmetros e “Dense” com 31 bilhões de parâmetros;
- Em termos de inteligência, o Google afirma que conseguiu até então um nível sem precedentes de “inteligência-por-parâmetro” com a Gemma 4;
- Essa afirmação é sustentada pelo desempenho das variantes de 31 bilhões e 26 bilhões de parâmetros, que conquistaram o terceiro e sexto lugares, respectivamente, no leaderboard de texto da Arena AI, superando modelos até 20 vezes maiores.
Todos os modelos Gemma 4 conseguem processar vídeos e imagens, sendo perfeitos para tarefas como reconhecimento óptico de caracteres. Os modelos menores, além disso, conseguem analisar entradas de áudio e entender fala. Outra característica importante é a capacidade dos modelos de gerar código offline, permitindo a programação sem precisar de conexão com a internet.
Além disso, a Gemma 4 foi treinada para funcionar em mais de 140 idiomas, refletindo a intenção do Google de desenvolver modelos versáteis e acessíveis globalmente.
Os modelos Gemma 4 estão sendo lançados sob a licença Apache 2.0, representando uma mudança em relação às versões anteriores, que utilizavam a licença própria da Gemma. Esse tipo de licenciamento oferece mais liberdade para desenvolvedores ajustarem os sistemas conforme necessário, garantindo controle completo sobre dados, infraestrutura e modelos.
“Essa licença de código aberto oferece total flexibilidade para os desenvolvedores e soberania digital, assegurando controle completo sobre dados, infraestrutura e modelos”, afirmou o Google. “Ela permite criar livremente e implantar com segurança em qualquer ambiente, seja local ou na nuvem.”
Para quem quiser testar os sistemas Gemma 4, os pesos dos modelos estão disponíveis nas plataformas Hugging Face, Kaggle e Ollama. A iniciativa do Google de tornar os modelos mais acessíveis reforça seu compromisso com a inovação colaborativa no campo da inteligência artificial (IA).

Google Vids recebe controle de avatares por comandos de texto
O Google também lançou, nesta quinta-feira (2), novas funções no seu aplicativo de edição de vídeos, o Vids. Entre as novidades, destaca-se a possibilidade de criar e personalizar avatares usando comandos de texto. O app agora também integra o Veo 3.1, permite exportar vídeos diretamente para o YouTube e inclui uma extensão para gravação via Chrome.
Com comandos em linguagem natural, os usuários podem fazer os avatares “atuarem” em cenas específicas, interagindo com produtos, objetos ou equipamentos.
O Google garante que, mesmo com essas interações dinâmicas, o Vids mantém a consistência dos personagens. Além disso, é possível ajustar aparência, roupas e cenários dos avatares por meio de comandos, de acordo com o tema do vídeo.
No mês passado, o Vids recebeu os modelos de criação musical Lyria 3 e Lyria 3 Pro, permitindo adicionar trilhas sonoras ou efeitos aos clipes. Com esta atualização, a empresa trouxe o modelo de geração de vídeos Veo 3.1, que cria clipes de até oito segundos diretamente na ferramenta de edição.
Todos os usuários têm direito a dez gerações gratuitas por mês. Para contas Google AI Ultra e Workspace AI Ultra, é possível gerar até mil vídeos Veo mensalmente.
Um dos recursos mais esperados é a exportação direta para o YouTube, eliminando a necessidade de baixar e enviar os vídeos manualmente. Por padrão, os vídeos exportados ficam privados, permitindo revisão antes de serem compartilhados publicamente.

Além disso, o Vids ganhou uma nova extensão para o Chrome, que permite aos usuários capturar a tela com áudio ou vídeo, aumentando as possibilidades criativas dentro do ecossistema do aplicativo.
Desde seu lançamento em 2024, voltado inicialmente para criação de conteúdo empresarial, o Vids passou por diversas atualizações. No ano passado, o app incorporou avatares de IA e expandiu seu público para usuários em geral. Em fevereiro deste ano, foram adicionados avatares em 2D e 3D no estilo cartoon, além do suporte a sete novos idiomas para narração, incluindo o português.
Fonte: Olhar Digital
Previous Post
Next Post