Nos últimos tempos, os pesquisadores do Google têm trabalhado incansavelmente, publicando uma série de novos modelos e ideias. O mais recente é uma forma de transformar uma imagem estática em um avatar controlável, surgindo a partir de um agente de inteligência artificial especializado em jogos. Embora o VLOGGER ainda não esteja disponível para experimentação, a demonstração sugere que permitirá criar um avatar e controlá-lo com sua voz, com resultados realistas.
Se você já se perguntou como seria criar um avatar realista a partir de uma foto, o VLOGGER pode ser a resposta. Com a nova tecnologia do Google, crie um avatar humano em 3D com uma foto e controle-o usando sua própria voz. Embora já existam ferramentas semelhantes no mercado, o VLOGGER parece oferecer uma opção mais simples e com menor consumo de dados. Enric Corona, cientista do Google, propõe VLOGGER para gerar vídeo humano falante com texto e áudio de uma única imagem.
Principais Pontos
- VLOGGER, nova tecnologia do Google, cria avatar humano em 3D a partir de uma foto e é controlado pela própria voz.
- Embora já existam ferramentas semelhantes no mercado, o VLOGGER parece oferecer uma opção mais simples e com menor consumo de dados.
- Enric Corona, cientista do Google, propõe o VLOGGER para gerar vídeo humano falante com base em texto e áudio de uma única imagem.
Mas, afinal, o que é o VLOGGER?
O VLOGGER é um modelo de inteligência artificial (IA) desenvolvido pelo Google capaz de criar um avatar animado a partir de uma imagem estática. Ele mantém a aparência fotorrealista da pessoa em cada quadro do vídeo final. Além disso, o modelo utiliza um arquivo de áudio da pessoa falando e controla os movimentos do corpo e dos lábios para refletir a maneira natural como essa pessoa se moveria se estivesse realmente pronunciando as palavras.
Uma das principais aplicações da tecnologia está na tradução de vídeos. O VLOGGER permite ajustar os movimentos dos lábios e do rosto de um vídeo existente para combinar com um novo áudio traduzido. Isso seria especialmente útil para empresas que precisam traduzir vídeos para diferentes idiomas.
Outras possibilidades incluem a criação de avatares animados para assistentes virtuais, chatbots ou personagens virtuais que parecem e se movem de forma realista em ambientes de jogos. Embora já existam ferramentas semelhantes, como o Synthesia, o VLOGGER parece tornar o processo muito mais fácil e acessível.
Uma das possíveis aplicações futuras também é a comunicação por vídeo. Uma versão aprimorada do modelo poderia permitir videochamadas a partir de um avatar animado gerado a partir de uma imagem estática. Seria útil em ambientes de realidade virtual, como Meta Quest ou Apple Vision Pro, independentemente dos modelos de avatar das plataformas.
Por enquanto, o VLOGGER é apenas um projeto de pesquisa com alguns vídeos de demonstração divertidos. No entanto, se algum dia se tornar um produto, ele poderá representar uma nova forma de comunicação no ambiente de trabalho, seja utilizando Teams ou Slack.
Conclusão
A tecnologia avança cada vez mais e o Vlogger AI do Google é um exemplo disso. Com a possibilidade de criar avatares realistas a partir de uma foto e controlá-los por voz, essa tecnologia pode ter aplicações interessantes em diversas áreas, como na criação de personagens em jogos e filmes, em treinamentos virtuais e até mesmo em terapia, onde um avatar realista pode ajudar no tratamento de fobias e transtornos mentais.
No entanto, é importante lembrar que essa tecnologia ainda está em fase de pesquisa e desenvolvimento, e pode levar algum tempo até que esteja disponível para o público em geral. Além disso, é preciso levar em consideração as questões éticas envolvidas no uso de avatares realistas, como a possibilidade de uso indevido em fraudes ou crimes.
Fique por dentro das notícias e atualizações sobre inteligência artificial com o GEX News.