Google ha lanzado VideoPoet, un modelo de generación de video basado en lenguaje natural (LLM). Puede realizar diversas tareas, como texto a video, imagen a video, estilización de video, y generar audio a partir de un video. Utiliza varios tokenizadores para trabajar con datos discretos y demuestra su capacidad para generar videos más largos, editar videos existentes y aplicar control sobre la cámara y el movimiento. Aunque no se ha anunciado su disponibilidad, Google ha utilizado el modelo para producir un cortometraje, sugiriendo su integración en futuras aplicaciones.