Un grand modèle d'IA de texte à vidéo développé en Chine dévoilé à Pékin
Vidu, un grand modèle d'intelligence artificielle (IA) de type texte-vidéo capable de créer une vidéo haute définition de 16 secondes en résolution 1080p d'un simple clic, a été dévoilé samedi lors du forum Zhongguancun 2024, à Beijing.
Développé par l'Université Tsinghua et l'entreprise chinoise d'IA ShengShu Technology, Vidu est le premier grand modèle d'IA vidéo de Chine avec "une durée prolongée, une cohérence exceptionnelle et des capacités dynamiques".
En tant que grand modèle d'IA développé en Chine, Vidu est capable de comprendre et de générer des contenus chinois tels que le panda et le loong (le dragon chinois), selon Zhu Jun, directeur adjoint de l'Institut d'intelligence artificielle de Tsinghua.
L'entreprise a déclaré que l'architecture fondamentale de Vidu avait été proposée dès 2022.