Whisk: Google desafia Midjourney com IA que entende imagens
Novo gerador de imagens dispensa os longos prompts em texto e deixa você "remixar" fotos existentes para criar novas obras
Novo gerador de imagens do Google, chamado Whisky, dispensa os longos prompts em texto e deixa você “remixar” fotos existentes para criar novas obras
Por que importa: A ferramenta Whisk representa uma mudança interessante na forma como interagimos com IAs geradoras de imagens, tornando o processo mais intuitivo e visual.
Como funciona:
- Basta arrastar e soltar fotos na ferramenta
- A IA “entende” o assunto, a cena e o estilo das imagens de referência
- Você pode usar múltiplas imagens como inspiração
- Textos são opcionais para refinar o resultado
🎲 Sem referências? Não tem problema. A ferramenta oferece um botão “dado” que gera imagens aleatórias para usar como base.
Nos bastidores, o Whisk usa duas IAs poderosas da Google:
- Gemini: converte automaticamente as imagens em prompts detalhados
- Imagen 3: gera as novas imagens a partir desses prompts
A empresa faz questão de avisar que a ferramenta foi feita para “exploração visual rápida, não edições perfeitas em nível de pixel” – ou seja, é mais para brincar e experimentar do que para trabalhos profissionais precisos.
↳ Se o resultado não agradar, você pode editar manualmente os prompts gerados pela IA
📱 Disponibilidade: Por enquanto apenas nos EUA, sem previsão de lançamento global
Por que é diferente: Enquanto outras IAs como DALL-E e Midjourney dependem fortemente de descrições textuais complexas, o Whisk busca simplificar o processo tornando-o mais visual e intuitivo.
Comentários
Sua voz importa aqui no B9! Convidamos você a compartilhar suas opiniões e experiências na seção de comentários abaixo. Antes de mergulhar na conversa, por favor, dê uma olhada nas nossas Regras de Conduta para garantir que nosso espaço continue sendo acolhedor e respeitoso para todos.