Modelo generativo capaz de transformar descrições em linguagem natural em simulações físicas 2D realistas. Projeto voltado para aprendizado, experimentação e pesquisa em world models.
Este projeto propõe o desenvolvimento de um world model treinado para gerar simulações físicas 2D a partir de prompts em linguagem natural. O modelo é capaz de interpretar descrições textuais de cenários físicos e gerar vídeos correspondentes que ilustram a cinemática e a dinâmica dos objetos descritos.
O trabalho serve como uma ferramenta prática de experimentação em arquiteturas generativas e resulta em um artigo de revisão sobre o tema.
-
Construir um modelo funcional para geração de simulações físicas a partir de texto.
-
Proporcionar experiência prática da equipe no desenvolvimento de world models.
-
Produzir um artigo de revisão sobre world models
-
Input de Linguagem Natural: Recebe prompts descritivos com propriedades de objetos (massa, cor, posição, velocidade).
-
Simulação Física 2D: Gera vídeos mostrando a dinâmica e cinemática dos objetos.
-
Múltiplos Cenários: Simula interações entre até 3 objetos simultaneamente.
-
Métricas de Avaliação: Calcula erro médio de previsão de trajetória e outras métricas de consistência física.
- Ambiente de simulação em 2D.
- Relatório detalhado da arquitetura desenvolvida.
- Modelo treinado e validado.
- Dataset utilizado no processo.
- Repositório GitHub com código e documentação.
- Apresentação consolidando resultados e aprendizados.
Este projeto está sob a licença MIT. Veja o arquivo LICENSE para mais detalhes.
Atualmente, o projeto está na fase de aquisição de dados externos e/ou geração de dataset próprio.