Fica explicado porque motivo a World Labs se apressou a mostrar o seu modelo AI de transformação de imagens para mundos 3D. É que o seu sistema se torna "obsoleto" quando comparado com as capacidades bastante mais vastas do Genie 2. Criado pela DeepMind da Google, o Genie 2 pode criar mundos 3D interactivos que se assemelham a videojogos. Este sucessor do modelo Genie original transforma simples descrições de texto ou imagens (como "um robot humanóide numa floresta") em ambientes interactivos, onde os utilizadores podem interagir através de teclados ou ratos, realizando acções como saltar ou nadar.
O Genie 2 destaca-se por simular animações, iluminação, física e até comportamentos de NPCs em tempo real. Muitos dos mundos que cria têm semelhanças notáveis com jogos AAA, levantando questões sobre se os seus dados de treino incluem gravações de jogabilidade. Embora a DeepMind não revele as fontes de dados, suspeita-se que tenham sido usados os milhões de horas de vídeos no YouTube, abrangidos pelos termos de serviço da Google.
Genie 2: We now have Prompt-to-Game.
— AshutoshShrivastava (@ai_for_success) December 4, 2024
Google DeepMind introduced Genie 2, a foundation world model capable of generating an endless variety of action-controllable, playable 3D environments for training and evaluating embodied agents. Based on a single prompt image.
9 examples… pic.twitter.com/N5PT7LlWZP
— AshutoshShrivastava (@ai_for_success) December 4, 2024
— AshutoshShrivastava (@ai_for_success) December 4, 2024Apesar do seu potencial, o Genie 2 não é perfeito. Os mundos criados têm uma duração média de apenas 10 a 20 segundos e não possuem a complexidade de jogos tradicionais. Em vez disso, a DeepMind posiciona o modelo como uma ferramenta para criar protótipos de experiências interactivas e testar agentes AI em cenários diversificados. Uma das suas capacidades é a consistência nos cenários, lembrando-se de elementos que fiquem fora de vista e voltando a apresentá-los correctamente quando reaparecem, algo que muitos simuladores ainda não conseguem fazer, bastando olhar para o chão e depois para o horizonte para que se veja um mundo completamente diferente do que era apresentado originalmente.
Temos também algumas coisas caricatas que foram partilhadas pela equipa. Numa das experiências, a certa altura vê-se um "fantasma" a passar pelo cenário; e noutro caso, o personagem com uma prancha de snowboard decide abandonar a prancha e fazer o percurso de jogo a correr e a fazer acrobacias.
Sem comentários:
Enviar um comentário