SORA : Il nuovo strumento Text-to-Video di OpenAI

Avatar photo

Quando è stato introdotto ChatGPT, che consente di comunicare direttamente con l’intelligenza artificiale (IA), nessuno avrebbe potuto prevedere che gli stessi innovatori avrebbero presto creato un sistema capace di generare video iperrealistici a partire da semplici descrizioni testuali. La rivoluzione dell’IA è ormai alle porte ed è controversa, innovativa e rivoluzionaria. Non è ancora chiaro come cambierà il mondo, ma come la maggior parte delle innovazioni, ha il potenziale per cambiare tutto.

Il dilemma dell’Intelligenza Artificiale

L’Intelligenza Artificiale rappresenta attualmente il tema più candente nel mondo tecnologico. Ingegneri, industrie tecnologiche e startup si impegnano nella creazione di sistemi sempre più potenti, capaci di compiere gesta straordinarie per noi. Tuttavia, le opinioni divergono sulla validità di questa iniziativa e sugli obiettivi dello sviluppo dell’IA.

Le preoccupazioni riguardano soprattutto le implicazioni etiche dell’IA e della sicurezza. Come possiamo determinare se un video generato dall’IA è autentico o falso? Come possiamo garantire che non venga utilizzato per scopi politici? È una minaccia per i posti di lavoro umani in diverse professioni, considerando quanto efficiente e produttiva possa essere l’IA? Alcuni temono addirittura che l‘IA possa conquistare il mondo e sostituire gli esseri umani, come mostrato nel film Ex Machina.

Indipendentemente dal fatto che siate sostenitori o critici di questa tecnologia, la realtà è che l’IA è già qui e, come molte invenzioni rivoluzionarie, presenta lati positivi e negativi. Tra i benefici più evidenti ci sono il miglioramento delle nostre vite e del nostro lavoro, l’incremento nell’assistenza sanitaria, nell’istruzione, negli affari e così via. In effetti, l’evoluzione umana è sempre progredita, e questo rappresenta solo il prossimo passo nella progressione della rivoluzione industriale. Ma quanto è rivoluzionario?

“Se la nostra era è la prossima rivoluzione industriale, come molti sostengono, l’IA è sicuramente una delle sue forze trainanti”.

Fei Fei Li, informatico americano di origine cinese

Una nuova rivoluzione nell’intelligenza artificiale visiva

OpenAI ha presentato Sora, il suo più recente sistema di intelligenza artificiale capace di trasformare descrizioni scritte in immagini realistiche. Attualmente, il modello di intelligenza artificiale Sora è in grado di creare video con una durata massima di 60 secondi, basandosi su istruzioni composte solo da testo o da una combinazione di testo e immagini. Sora si basa in parte sulle precedenti innovazioni di OpenAI, tra cui i modelli linguistici GPT e il generatore di immagini DALL-E. 

Come l’innovazione di OpenAI trasforma il testo in video iper-realistici

Il modo in cui l’innovazione di OpenAI trasforma il testo in video iper-realistici è evidenziato nel video seguente, che presenta Sora in azione. Gli esempi mostrano situazioni come un golden retriever che gioca nella neve, un trailer cinematografico con un attore dall’aspetto realistico e una visione convincente di una donna a Tokyo, come se fosse stata ripresa da una telecamera.  Tutti i video creati sono accurati rispetto ai comandi testuali inseriti e presentati con viste molto realistiche, simili a quelle di telecamere o droni, generati da Sora senza modifiche, secondo quanto affermato da OpenAI.

https://www.youtube.com/watch?v=HK6y8DAPN_0

Il lancio di Sora

Sora rappresenta l’ultima innovazione nell’intelligenza artificiale capace di produrre video realistici a partire da dati testuali. Al momento, non è disponibile al pubblico, poiché OpenAI ha limitato l’accesso a un gruppo selezionato di artisti visivi, designer e registi che lo stanno testando e fornendo feedback all’azienda. Tuttavia, l’azienda ha in programma di renderlo disponibile al pubblico nel prossimo futuro. 

Finora, alcuni esperti hanno espresso le loro opinioni sul modello Sora. Per esempio, Jim Fan di Nvidiaha dichiarato che si tratta di un “motore fisico guidato dai dati ” capace di simulare mondi, definendolo un’innovazione molto superiore rispetto agli altri “giochi creativi” di OpenAI. D’altra parte, Gary Marcus, CEO di Robust.AI e Geometric Intelligence (acquisita da Uber), ha sollevato dubbi sul modello generativo di intelligenza artificiale utilizzato da Sora per la sintesi video e sull’accuratezza dei video prodotti, affermando: “Il sistema cerca di approssimare il mondo, ma non è molto abile in questo compito“. Secondo CBS News , la nuova tecnologia ha suscitato timori in alcuni esperti di intelligenza artificiale.  

Il rischio legato ai contenuti generati dall’IA

La rivoluzione dell’IA generata dalle immagini comporta potenziali cambiamenti nel modo di lavorare per la maggior parte dei settori, dai professionisti creativi, come designer, creatori di contenuti e professionisti del cinema, dove gli attori potrebbero essere sostituiti o le riprese alterate, alle aziende di media e intrattenimento e ai giornalisti. Se da un lato c’è entusiasmo per l’avanzamento della tecnologia AI attraverso questo modello di creazione di video, dall’altro emergono preoccupazioni sulla possibilità che i video deepfake artificiali possano amplificare la disinformazione in tutto il mondo, specialmente in occasione delle elezioni mondiali del 2024. Alcune celebrità sono già state prese di mira e diffuse notizie false su di loro. Ad esempio, la voce e il volto generati dall’AI di Scarlett Johansson sono stati utilizzati in una pubblicità senza il suo consenso

Per garantire un utilizzo responsabile dell’intelligenza artificiale generata visivamente, lo sviluppo di questa tecnologia richiederà sempre più forti standard etici, quadri giuridici e soluzioni tecniche, come il controllo dell’autenticità e il watermarking. L’anno scorso, il Presidente degli Stati Uniti Joe Biden ha annunciato l’emissione di un nuovo ordine esecutivo sull’IA, che impone ulteriori precauzioni di sicurezza e l’implementazione del watermarking per identificare chiaramente il lavoro creato dall’intelligenza artificiale.

Il futuro dell’intelligenza artificiale generativa visiva 

Il settore è in fase di cambiamento di paradigma, e il settore dei media visivi è destinato a subire una trasformazione radicale. I sistemi visivi dell’intelligenza artificiale diventeranno sempre più sofisticati, consentendo la creazione di immagini, filmati e ambienti virtuali sempre più elaborati e realistici. Questo sviluppo potrebbe portare a metodi creativi per narrare storie, alla creazione di contenuti personalizzati e a esperienze coinvolgenti di realtà virtuale e aumentata. Nonostante ciò, il progresso dell’IA non implica necessariamente la perdita di posti di lavoro umani; piuttosto, crea opportunità di collaborazione tra l’uomo e l’IA per produrre risultati precedentemente impensabili.

Tuttavia, in assenza di leggi adeguate, questo potenziale presenta una serie di gravi preoccupazioni. Per mitigare questi pericoli, è fondamentale che aziende come OpenAI, Google, Meta e startup come Runway, coinvolte in progetti di IA text-to-video, adottino linee guida rigorose. Sulla pagina di OpenAI si legge che l’azienda “sta adottando diverse misure di sicurezza importanti prima di rendere Sora disponibile nei prodotti di OpenAI”, quindi speriamo che l’era dell’IA inizi quando i governi e le organizzazioni avranno le regole e i regolamenti adeguati per affrontare questa sfida in modo responsabile e sicuro.


Total
0
Shares
Messaggio precedente

Guida ai LED a infrarossi (IR) di Intelligent LED Solutions

Messaggio successivo

Come vengono utilizzati i robot nell’industria alimentare

Pubblicazioni simili