Sora – det nye tekst-til-videoverktøyet fra OpenAI

Avatar photo

ChatGPT gjorde det mulig å direkte kommunisere med kunstig intelligens, men det var neppe mange som forutså at de samme innovatørene snart ville skape et system som var i stand til å generere realistiske videoer fra enkle tekstbeskrivelser. AI-revolusjonen er her og er både kontroversiell og banebrytende. Hvordan verden kommer til å endres som resultat er fortsatt usikkert, men som de fleste innovasjoner har det potensialet til å endre ganske mye.

Problemet med AI

Kunstig intelligens er et av de heteste temaene på markedet. Ingeniører, teknologiselskaper og oppstartsbedrifter prøver alle å lage kraftige AI-systemer som kan gjøre utrolige ting for oss. Men meningene er delte om hvorvidt dette er en positiv ting og hva formålet med å utvikle AI faktisk er.

Bekymringene handler i det store og hele om etikk og sikkerhet. Vil vi være i stand til å bestemme om en AI-generert video er ekte eller falsk? Hvordan kan vi sørge for at dette ikke blir utnyttet på en politisk eller skruppelløs måte? Med tanke på hvor effektiv og produktiv AI kan være, vil det også true jobbene våre? Mange er bekymret for at AI kommer til å ta over verden og erstatte mennesker.

Enten du er fan av teknologien eller ikke; AI er her allerede, med positive og negative sider. De åpenbare fordelene forbedrer livene våre og jobbene våre, helsevesenet, utdanning og bedrifter. Menneskeheten har alltid utviklet seg og dette er neste trinn i denne utviklingen. Men hvor revolusjonært er det egentlig?

“Hvis vår tidsalder er den neste industrielle revolusjonen, som mange hevder, er AI utvilsomt en av drivkreftene.”

Fei Fei Li, kinesisk-amerikansk informatiker

En ny visuell AI-revolusjon

OpenAI lanserte i år det kunstige intelligensystemet, Sora, som kan forvandle tekstbeskrivelse til videoer. I dag kan AI-modellen lage videoer som er opptil 60 sekunder lange basert på tekst alene eller tekst- og bildeinstruksjoner. Sora er delvis bygget på OpenAIs tidligere innovasjoner, som språkmodellen GPT og bildegeneratoren DALL-E. 

Hvordan forvandles tekst til video?

Videoen nedenfor viser hvordan Sora lager video basert på tekst. Her ser vi blant annet et kull med valper som leker i snøen, en sci-fi filmtrailer og en kvinne på et tog i Tokyo som filmer utsikten.Videoene ser alle ut til å følge tekstbeskrivelsene, presenteres som video- eller droneopptak og er ifølge OpenAI ‘generert av Sora uten modifikasjoner’.

https://www.youtube.com/watch?v=HK6y8DAPN_0

Lansering av Sora

Så langt har OpenAI begrenset bruken til en utvalgt gruppe billedkunstnere, designere og filmskapere som tester den og gir innspill til selskapet. Planen er å lansere Sora for offentligheten ved et senere tidspunkt. 

Flere eksperter har så langt uttrykt sine meninger om AI-modellen og Jim Fan fra Nvidia kommenterte at Sora er en ‘datadreven fysikkmotor‘ som kan simulere verdener. Han synes AI-modellen er en mye bedre innovasjon sammenlignet med andre ‘kreative leketøy’ fra OpenAI. På en annen side stilte Gary Marcus, direktør ved Robust.AI og Geometric Intelligence, spørsmål ved den generative AI-modellen Sora bruker, samt hvor nøyaktige videoene den produserer er: ‘Systemet prøver å tilnærme seg verden, men det er den ikke særlig flink til.‘ Ifølge CBS News har den nye modellen gjort noen AI-eksperter ‘livredde’ og sier at dette blant annet kan ha alvorlige følger for demokratiet og filmbransjen. 

Problemet med AI-generert innhold

Den nye utviklingen har potensial til å endre flere bransjer, fra kreative yrker som designere, innholdsskapere, regissører og journalister. Selv om mange er begeistret er det også mange som er bekymret for at kunstige deepfake-videoer kan bidra til å forsterke feilinformasjon rundt om i verden, for eksempel i forbindelse med de ulike valgene som vil finne sted rundt om i verden i år. Noen kjendiser har allerede vært utsatt for dette og et AI-generert ansikt og stemmen til Scarlett Johansson ble for eksempel brukt i en reklame uten at hun hadde gitt tillatelse for det 

For å garantere ansvarlig bruk av denne type teknologi er det viktig å fastslå etiske standarder og lovmessige rammeverk. Teknologiske løsninger, som autentisitetskontroll og vannmerking, vil også være viktig her. I fjor kunngjorde USAs president Joe Biden en ny forordning om kunstig intelligens som krever ytterligere sikkerhetstiltak og vannmerking for å tydelig identifisere arbeid som er skapt av kunstig intelligens.

Hva vil fremtiden bringe?

Bransjen er vitne til et stort skifte og fremtidens visuelle medier kommer til å endre seg dramatisk. Visuelle AI-systemer kommer til å bli mer sofistikerte og vil kunne lage enda mer realistiske bilder og filmer. Dette kan føre til nye metoder for å formidle historier, skreddersydd innhold og engasjerende opplevelser i virtuell og utvidet virkelighet. Dette betyr ikke at mennesker kommer til å miste jobbene sine, men heller at det skapes muligheter for samarbeid mellom mennesker og kunstig intelligens som kan føre til uante resultater.

Mangelen på hensiktsmessige lover gjør imidlertid at dette potensialet er forbundet med en rekke alvorlige hensyn. For å redusere disse er det avgjørende at bedrifter som er involvert i denne type teknologi følger strenge retningslinjer. På selskapets nettside hevder OpenAI at de holder på å utvikle ‘flere viktige sikkerhetstiltak før Sora blir tilgjengelig i OpenAIs produkter’. Vi kan bare håpe at tidsalderen ikke starter for fullt før de rette reglene og forskriftene er på plass.


Total
0
Shares
Forrige innlegg

En guide til infrarøde LED fra Intelligent LED Solutions

Neste innlegg

Hvordan brukes roboter i matsektoren?

Relaterte innlegg