Nach dem Chatbot ChatGPT, der die direkte Kommunikation mit künstlicher Intelligenz (KI) ermöglicht, stellt OpenAI nun ein weiteres generatives KI-Tool vor: Sora. Mit diesem Tool können sofort Videos aus schriftlichen Anweisungen erstellt werden. Spätestens seit der Veröffentlichung von ChatGPT ist klar geworden, dass wir vor einer KI-Revolution stehen. Wie genau sie die Welt verändern wird, ist noch unklar, aber es zeichnen sich schon einige Vorteile dieser bahnbrechenden Entwicklungen an. Allerdings gibt es auch einige Bedenken hinsichtlich der KI-Revolution.
Das KI-Dilemma
Künstliche Intelligenz ist derzeit DAS Thema in der Technologiebranche. Technologieunternehmen und Start-ups streben danach, immer leistungsfähigere KI-Systeme zu entwickeln. Diese Entwicklung wird nicht von allen positiv aufgenommen. Viele äussern ihre Bedenken gegen solche leistungsfähigen KI-Systeme.
Bei den Bedenken handelt es sich vor allem um ethische und um Sicherheitsbedenken. Wie werden wir feststellen können, ob ein Video echt oder von KI generiert ist? Wie können wir sicherstellen, dass KI nicht für politische Zwecke missbraucht wird? Wird sie unsere Arbeitsplätze gefährden, wenn man bedenkt, wie effizient und produktiv KI sein kann? Oder wird sie die menschliche Intelligenz ersetzen und die Kontrolle übernehmen, wie in dem Film Ex Machina?
Ob Sie nun ein Fan dieser Technologie sind oder nicht, KI ist bereits fest in unserem Alltag integriert, was einige Vorteile mit sich bringt. Die künstliche Intelligenz erleichtert unseren Alltag und trägt unter anderem zu Verbesserungen im Gesundheitswesen, im Bildungswesen und der Wirtschaft bei. In der Geschichte der Menschheit gab es schon einige Innovationen, die industrielle Revolutionen ausgelöst haben, da ist KI nur der nächste Schritt in der industriellen Revolution. Doch wie revolutionär ist künstliche Intelligenz wirklich?
„Wenn unser Zeitalter die nächste industrielle Revolution ist, wie viele behaupten, dann ist KI sicherlich eine der treibenden Kräfte.“
Fei Fei Li, KI-Expertin und Stanford-Professorin
Eine neue visuelle KI-Revolution
Mit Sora stellt OpenAI sein neues generatives KI-Tool vor, das schriftliche Beschreibungen in realistische Bilder umwandeln kann. Derzeit kann das KI-Modell Videos mit einer Länge von bis zu 60 Sekunden erstellen, die nur auf Text oder auf Text- und Bildanweisungen basieren. Sora baut damit auf frühere Innovationen von OpenAI auf, wie die grossen Sprachmodelle GPT und der Bildgenerator DALL-E.
Wie die Innovation von OpenAI Text in hyperrealistische Videos verwandelt
Im folgenden Video stellt OpenAI Sora vor und zeigt einige Beispielvideos, die anhand von Textanweisungen von dem KI-Tool erstellt wurden. Darunter befindet sich ein Video von Golden-Retriever-Welpen, die im Schnee spielen, ein Filmtrailer mit einem realistisch aussehenden Schauspieler und die Luftaufnahme einer Drohne am Big Sur Garay Point Beach. Alle erstellten Videos entsprachen genau den eingegebenen Textbefehlen, wurden in sehr realistischen Ansichten wie Kameras oder Drohnen präsentiert und laut OpenAI „von Sora ohne Änderungen generiert“.
Wann ist Sora verfügbar?
Sora ist noch nicht öffentlich verfügbar. Zurzeit darf nur eine ausgewählte Gruppe von bildenden Künstlern, Designern und Filmemachern das KI-Tool nutzen und Video-Ideen liefern. Bald soll Sora jedoch auch für die Öffentlichkeit verfügbar sein.
Einige KI-Experten haben sich bereits zu dem neuen KI-Tool geäussert. So sagte Jim Fan von Nvidia, es handele sich bei Sora um eine „datengesteuerte Physikmaschine“, die Welten simulieren könne, und sei daher eine bessere Innovation als die anderen „kreativen Spielzeuge“ von OpenAI. Gary Marcus, der CEO von Robust.AI und Geometric Intelligence (von Uber übernommen), stellte hingegen das generative KI-Modell, das Sora für die Videosynthese verwendet, sowie die Genauigkeit der produzierten Videos infrage: „Das System versucht, die Welt zu approximieren, aber es ist einfach nicht sehr gut darin“. Unter den Experten gibt es laut CBS News aber auch welche, die ‚Angst‘ vor dem neuen Tool und dem, was es machen kann, haben.
Das Risiko von KI-generierten Inhalten
Durch die visuelle-generative KI-Revolution könnten zahlreiche Jobs in der Unterhaltungsindustrie, wie Designer, Content Creators, Filmemacher und Schauspieler, aber auch Jobs im Medien- und Journalismusbereich gefährdet sein. Doch nicht nur Arbeitsplätze könnten gefährdet sein, sondern auch die Demokratie. Solche Deepfake-Videos könnten die Desinformation auf der ganzen Welt verstärken, was besonders in diesem Jahr problematisch werden könnte, da in mehreren Ländern der Welt wichtige Wahlen stattfinden. Einige Prominente, wie Scarlett Johansson, haben wegen Deepfake-Videos schon rechtliche Schritte eingeleitet. Die US-Schauspielerin verklagte eine KI-App, die ohne ihre Erlaubnis ein KI-generiertes Abbild sowie eine künstlich generierte Stimme von ihr für eine Werbung verwendet hatte.
Um eine verantwortungsvolle Nutzung der visuell-generativen KI zu gewährleisten, werden strenge ethische Standards, rechtliche Rahmenbedingungen und technische Lösungen (z. B. Authentizitätsprüfung und Wasserzeichen) im Zuge der Weiterentwicklung der Technologie erforderlich sein. Vergangenes Jahr kündigte US-Präsident Joe Biden eine neue Durchführungsverordnung zur KI an, in der zusätzliche Sicherheitsvorkehrungen und Wasserzeichen zur eindeutigen Kennzeichnung von durch künstliche Intelligenz geschaffenen Werken gefordert werden.
Die Zukunft der visuell-generativen KI
Die Branche ist Zeuge eines Paradigmenwechsels, und die Zukunft der visuellen Medien wird sich bald dramatisch verändern. Die visuellen KI-Systeme werden immer ausgefeilter und ermöglichen die Erstellung von immer aufwendigeren und realistischeren Bildern, Filmen und virtuellen Umgebungen. Dies könnte zu kreativen Methoden für die Vermittlung von Geschichten, zur Erstellung massgeschneiderter Inhalte und zu fesselnden Virtual- und Augmented-Reality-Erlebnissen führen. Statt sie zu ersetzen, sollte die KI ein Hilfsmittel für die Beschäftigten in der Unterhaltungsbranche sein.
Trotzdem sollten Entscheidungsträger weltweit klare Regeln für KI-generierte Inhalte vorschreiben, um Missbräuche zu verhindern. Um diese Gefahren zu verringern, ist es wichtig, dass Unternehmen wie OpenAI, Google, Meta und Start-ups wie Runway, die an Text-zu-Video-KI-Projekten beteiligt sind, strenge Richtlinien befolgen. OpenAI selbst gibt an, dass das Unternehmen „mehrere wichtige Sicherheitsmassnahmen ergreift, bevor Sora in den Produkten von OpenAI verfügbar gemacht wird“. Trotzdem sollten schnell klare Regeln im Umgang mit KI-Inhalten geschaffen werden, damit das Zeitalter der generativen KI nicht zu einem Zeitalter der Desinformation wird.