Le 10 décembre 2024, OpenAI a officiellement lancé Sora, son modèle de génération de vidéos par intelligence artificielle. Cette annonce marque une étape importante dans le domaine de l’IA générative, promettant de révolutionner la création de contenu vidéo.
Une contribution de Pierre-Clément Cazon, responsable acquisition au sein de l’Agence GW et créateur du réseau à but non lucratif ASP.eco.
Lancement prudent et limité
OpenAI a choisi une approche prudente pour le déploiement de Sora. Le service est actuellement accessible via les abonnements ChatGPT Plus (20 dollars par mois) et ChatGPT Pro (200 dollars par mois). Cependant, la disponibilité géographique est restreinte : Sora est disponible dans plus de 150 pays, mais l’Europe, le Royaume-Uni et la Suisse sont exclus pour le moment.
Système de crédits et limitations
Le modèle d’accès à Sora repose sur un système de crédits :
- ChatGPT Plus : 50 vidéos par mois (1000 jetons), limitées à 5 secondes en 720p avec un filigrane visible.
- ChatGPT Pro : 500 vidéos (10 000 jetons), jusqu’à 20 secondes en 1080p, possibilité de téléchargement sans filigrane.
OpenAI prévoit d’introduire une tarification personnalisée pour différents types d’utilisateurs au début de l’année prochaine, laissant entrevoir un abonnement dédié aux professionnels de la vidéo et de la création.
Capacités impressionnantes et multimodalité
Sora se distingue par ses capacités multimodales. Le modèle peut générer des vidéos à partir de texte, d’images fixes ou de vidéos existantes. Cette flexibilité ouvre la porte à de nombreuses applications :
- Génération de vidéos à partir de descriptions textuelles
- Application d’effets à des vidéos existantes
- « Prolongement » de vidéos (avant ou après la séquence originale)
- Création de boucles vidéo infinies
L’interface de Sora a été conçue sous forme de « storyboard », permettant aux utilisateurs de spécifier ou préciser leurs prompts pour chaque image de la séquence. Le modèle peut générer des vidéos dans différents formats : paysage, vertical et carré.
Performances et limites
Les premiers retours sur Sora sont positifs, soulignant des rendus inédits dans la génération de vidéos complexes. Le modèle démontre une aptitude à maintenir la cohérence sur plusieurs dizaines de secondes, combinant actions et mouvements de caméra de manière réaliste. Cependant, OpenAI reconnaît certaines limitations :
- Gestion des dépendances : bien que souvent efficace, le modèle peut parfois échouer à maintenir la cohérence des éléments sur toute la durée de la vidéo.
- Physique : certains phénomènes comme le fait de casser du verre ou de consommer de la nourriture peuvent encore poser problème.
- Hallucinations et erreurs d’interprétation : comme d’autres modèles d’IA, Sora n’est pas exempt de ces limites.
Gestion des risques et éthique
OpenAI accorde une grande importance à la gestion des risques liés à Sora. L’entreprise a mis en place plusieurs mesures de sécurité :
- Constitution d’une « red team » d’experts pour évaluer les risques.
- Intégration de filtres pour la protection de l’enfance (développés par Thorn).
- Restrictions sur les contenus liés à la nudité ou à la pornographie.
- Protections contre la génération de contenus trompeurs, notamment dans un contexte électoral.
- Utilisation d’un « watermark » invisible (norme C2PA) pour lutter contre la désinformation.
OpenAI admet que ces mesures ne sont pas infaillibles et continue de travailler sur l’amélioration de ses outils de détection et de protection.
Perspectives et implications
Le lancement de Sora marque une avancée significative dans le domaine de la génération de vidéos par IA. OpenAI présente son modèle comme un potentiel « simulateur de monde réel », ouvrant la voie à des applications allant bien au-delà de la simple création de contenu vidéo. Cette technologie soulève également des questions importantes sur l’avenir de la création audiovisuelle, les implications éthiques de la génération de contenu réaliste par IA, et les défis en matière de détection de fausses informations.
Conclusion
Sora représente une étape majeure dans l’évolution des technologies d’IA générative. Bien que son lancement soit prudent et limité, les capacités démontrées par le modèle laissent entrevoir un futur dans lequel la création de contenu vidéo pourrait être profondément transformée. Cependant, comme pour toute avancée technologique majeure, il sera crucial de surveiller de près son développement et son impact sur la société, en veillant à ce que son utilisation reste éthique et bénéfique.
Vous avez aimé cet article ? Likez Forbes sur Facebook
Newsletter quotidienne Forbes
Recevez chaque matin l’essentiel de l’actualité business et entrepreneuriat.
Abonnez-vous au magazine papier
et découvrez chaque trimestre :
- Des dossiers et analyses exclusifs sur des stratégies d'entreprises
- Des témoignages et interviews de stars de l'entrepreneuriat
- Nos classements de femmes et hommes d'affaires
- Notre sélection lifestyle
- Et de nombreux autres contenus inédits