SORA révélé : OpenAI présente son nouvel outil de conversion de texte en vidéo

Avatar photo

Lors de l’introduction de ChatGPT, qui permet de communiquer directement avec une intelligence artificielle (IA), personne n’aurait pu prédire que les mêmes innovateurs créeraient bientôt un système capable de générer des vidéos hyperréalistes à partir de simples descriptions textuelles. La révolution de l’IA est désormais imminente, marquée par des avancées à la fois controversées, novatrices et révolutionnaires. On ne sait pas encore comment elle changera le monde, mais comme la plupart des innovations, elle possède le potentiel de transformer radicalement notre façon de vivre, de travailler et d’interagir avec notre environnement.

Le dilemme de l’IA

L’intelligence artificielle est actuellement le sujet le plus brûlant et le plus discuté dans le monde de la technologie. Les ingénieurs, les industries technologiques et les startups s’efforcent tous de développer des systèmes d’IA de plus en plus puissants, aptes à accomplir des tâches remarquables à notre place. Toutefois, les avis sont partagés quant à savoir si cela est bénéfique ou non, et quel est l’objectif ultime du développement de l’IA.

Les préoccupations principales portent sur les implications éthiques de l’IA et sur la sécurité. Comment pourrons-nous distinguer une vidéo générée par l’IA d’une vidéo authentique ? Comment s’assurer qu’il ne sera pas utilisé à des fins politiques ? L’efficacité et la productivité de l’IA présentent-elles une menace pour les emplois humains dans diverses professions ? Certains expriment des inquiétudes quant à la possibilité que l’IA prenne le contrôle et remplace les humains, un scénario illustré dans le film Ex Machina.

Que l’on soit favorable ou non à cette technologie, il est indéniable que l’IA est déjà présente, et comme la plupart des inventions révolutionnaires, elle comporte à la fois des avantages et des inconvénients. Les avantages évidents incluent l’amélioration de nos vies et de notre travail, ainsi que des progrès dans des domaines tels que les soins de santé, l’éducation, les affaires, et bien d’autres encore. En réalité, l’humanité a toujours progressé, et l’IA ne représente que la prochaine étape dans l’évolution de la révolution industrielle. Mais dans quelle mesure cette révolution est-elle véritablement révolutionnaire ?

« Si notre époque est bel et bien considérée comme la prochaine révolution industrielle, alors l’IA en sera certainement l’un des principaux moteurs de cette transformation. »

Fei Fei Li, informaticienne américaine d’origine chinoise

Une nouvelle révolution visuelle créée par l’IA

OpenAI a récemment dévoilé Sora, son tout dernier système d’intelligence artificielle, capable de convertir des descriptions textuelles en images réalistes. À l’heure actuelle, le modèle d’IA Sora est capable de produire des vidéos d’une durée maximale de 60 secondes à partir d’instructions textuelles ou textuelles accompagnées d’images. Une partie des fondements de Sora s’appuie sur les innovations précédentes d’OpenAI, notamment les modèles de langage GPT et le générateur d’images DALL-E. 

Comment l’innovation d’OpenAI transforme-t-elle le texte en vidéos hyperréalistes ?

La vidéo ci-dessous présente Sora et démontre comment le système peut générer une vidéo en utilisant uniquement du texte. Les exemples comprennent des golden retrievers jouant dans la neige, une bande-annonce de film mettant en scène un acteur au visage réaliste, ainsi qu’une scène convaincante montrant une femme à Tokyo, comme capturée par l’objectif d’un appareil photo.Toutes les vidéos créées correspondaient aux instructions textuelles saisies, présentant des perspectives très réalistes semblables à celles capturées par des caméras ou des drones, et, comme l’indique OpenAI, étaient « générées par Sora sans aucune modification ».

https://www.youtube.com/watch?v=HK6y8DAPN_0

Lancement de Sora

Sora représente la dernière avancée en matière d’intelligence artificielle, capable de produire des vidéos réalistes à partir de données textuelles. Pour l’instant, Sora n’est pas accessible au grand public, car OpenAI a restreint son utilisation à un groupe sélectionné d’artistes visuels, de concepteurs et de cinéastes qui le testent et fournissent des commentaires à l’entreprise. Cependant, l’entreprise prévoit de rendre Sora accessible au grand public dans un avenir proche. 

Jusqu’à présent, quelques experts ont partagé leurs opinions sur le modèle Sora. Par exemple, Jim Fan de Nvidia a décrit Sora comme un « moteur physique basé sur les données » capable de simuler des mondes, soulignant qu’il s’agit d’une innovation bien plus significative que d’autres « jouets créatifs » développés par OpenAI. Par ailleurs, Gary Marcus, PDG de Robust.AI et ancien dirigeant de Geometric Intelligence (racheté par Uber), a remis en question le modèle d’IA générative utilisé par Sora pour la synthèse vidéo, ainsi que la précision des vidéos produites : « Le système tente d’approximer le monde, mais il n’est pas très performant dans ce domaine ». Selon CBS News, la nouvelle technologie a laissé certains experts en IA « terrifiés ». 

Le risque du contenu généré par l’IA

La révolution de l’IA visuelle et générative entraîne des changements dans les méthodes de travail de la plupart des secteurs. Cela concerne les professionnels de la création, tels que les designers, les créateurs de contenu et les réalisateurs de films, où les acteurs pourraient être remplacés ou les séquences modifiées. Cela affecte également les entreprises de médias et de divertissement, ainsi que les journalistes. Malgré l’enthousiasme suscité par les progrès de la technologie de l’IA grâce à ce modèle de création de vidéos, certains s’inquiètent de la possibilité que les vidéos artificielles « deepfake » exacerbent la désinformation à l’échelle mondiale, notamment lors des élections mondiales de 2024. Certaines célébrités ont déjà été ciblées et harcelées par des « fake news » impliquant des vidéos artificielles (deepfake). Par exemple, la voix et le visage de Scarlett Johansson, générés par l’IA, ont été utilisés dans une publicité sans son autorisation

Pour garantir une utilisation responsable de l’IA génératrice d’images, il deviendra de plus en plus nécessaire de mettre en place des normes éthiques strictes, des cadres juridiques appropriés et des solutions techniques telles que la vérification de l’authenticité et l’utilisation de filigranes. Ces mesures seront cruciales à mesure que la technologie se développera. L’année dernière, le président américain Joe Biden a annoncé la publication d’un nouveau décret sur l’IA, appelant à des précautions de sécurité supplémentaires et à l’utilisation de filigranes pour identifier clairement les travaux créés par l’intelligence artificielle.

L’avenir de l’IA visuelle et générative 

Le secteur est en train de connaître un changement de paradigme majeur, et l’avenir des médias visuels s’apprête à changer radicalement. Les systèmes d’IA visuelle deviendront plus sophistiqués et permettront la création d’images, de films et d’environnements virtuels de plus en plus élaborés et réalistes. Cela pourrait conduire à l’émergence de méthodes créatives pour raconter des histoires, à la création de contenus personnalisés, ainsi qu’à des expériences de réalité virtuelle et augmentée attrayantes. Le développement de l’IA ne signifie pas nécessairement que les humains perdront leur emploi ; au contraire, il crée des opportunités de collaboration entre l’homme et l’IA pour produire des résultats jusqu’alors inimaginables.

Toutefois, en l’absence de législations appropriées, ce potentiel suscite un certain nombre de préoccupations sérieuses. Pour atténuer ces risques, il est essentiel que des entreprises telles qu’OpenAI, Google, Meta et des start-ups comme Runway, engagées dans des projets d’IA de type texte-vidéo, respectent des règles strictes. Sur la page d’OpenAI, il est indiqué que l’entreprise « a pris plusieurs mesures de sécurité importantes avant de rendre Sora disponible dans les produits d’OpenAI ». Espérons que l’ère de l’IA commencera lorsque les gouvernements et les organisations auront adopté les bonnes règles et réglementations.


Total
0
Shares
Publication précédente

Guide sur les LED infrarouges (IR) par Intelligent LED Solutions

Publication suivante

Comment les robots sont utilisés dans l’industrie alimentaire

Publications similaire