Ich habe bei der Bildagentur Adobe Stock über 85.000 Bilder online und alle dieser Bilder sind – nach Shootings o.ä. sortiert – in „Collections“ einsortiert, damit ich diese mit dem Analysetool Stock Performer separat auslesen und meine Statistiken nach Collection getrennt analysieren kann.
Leider ist es oft sehr mühsam, alle Bilder auf einer Seite einzeln anklicken zu müssen, nur um diese 100 Bilder einer Collection zuzuweisen.
Mit der Hilfe von Jörg Stöber (siehe „Podcast eines Fotoproduzenten“-Folge 21) gibt es nun aber endlich eine Abhilfe. Mit der Installation eines kleinen und kostenlosen Greasemonkey/Tampermonkey-Skripts namens „Adobe Stock Portfolio Select All Images“ erscheint nach dem Neu-Laden der Adobe Stock-Portfolio-Seite der Button „select all“.
Damit lassen sich mit einem Knopfdruck gleich alle 100 Bilder auf der jeweiligen Seite markieren. Das spart also bei Bedarf 99 Mausklicks!
Wie installiere ich das Skript?
Installiere die kostenlose Erweiterung „Tampermonkey“ oder „Greasemonkey“ für Firefox, bzw. die kostenlose Erweiterung „Tampermonkey“ oder „Violentmonkey“ für Google Chrome. Für macOS (Safari), Opera und MS Edge gibt es sicher ähnliche Erweiterungen.
Lade zuerst die kostenlose UserScript-Datei „Adobe Stock Portfolio Select All Images“ hier herunter (ggf. „Speichern unter“ mit Rechtsklick).
Installiere das UserScript mit TamperMonkey bzw. den genannten Alternativen. Fertig.
Alternativ kannst Du auch direkt auf den Link klicken, wenn obige Erweiterung schon aktiviert ist, dann erkennt Tampermonkey das Skript und fragt, ob Du es benutzen möchtest. Das sieht dann ungefähr so aus:
Wie nutze ich das „select all“-Skript?
Wenn sowohl die Erweiterung als auch das UserScript aktiviert sind, kannst Du auf die Portfolio-Seite von Adobe Stock gehen und Du solltest wie im Screenshot oben den Text „Select All“ sehen. Wenn der nicht sichtbar ist, hilft in der Regel ein Refresh der Webseite. Durch das Klicken auf den Text werden alle 100 Bilder auf der Seite gleichzeitig selektiert.
Ich wünsche euch viel Zeitersparnis mit dem Skript.
Vor ziemlich genau zehn Jahren habe ich diesen ausführlichen Artikel über das Problem mit „Copycats“ in der Stockfotografie geschrieben.
Darin beschreibe ich die unfairen Vorteile, welche sich Mitbewerber verschaffen, wenn sie systematisch Besteller-Bilder anderer Fotografen kopieren und wie schwer es ist, dagegen vorzugehen:
„Rechtlich gesehen ist es leider schwer, gegen solche Kopien anzugehen, weil „nachgestellte Fotos“ im Gegensatz zu „identischen Fotos“ nicht automatisch einen Urheberrechtsverstoß bedeuten. Da kommt es darauf an, wie ähnlich sich Kopie und Original sehen und ist meist eine Auslegungssache des Gerichts.“
(Auszug aus dem zitierten Blogartikel)
Die Grenzen zwischen Inspiration und Plagiat sind auch schwer zu greifen, weshalb sich in der Stockfotografie-Szene meist der Gedanke durchgesetzt hat, dass wir alle irgendwo irgendwann von jemandem kopieren und ebenso kopiert werden. Das gehöre irgendwie dazu, vor allem, weil sich die gut verkaufenden Themen kaum ändern und so wenig Spielraum für Ausweichmöglichkeiten bleibt, wenn mensch diese Motive abdecken möchte („Business-Handshake“, anyone?).
So muss ich als durch meinen Blog und meine Publikationen besonders in der Öffentlichkeit stehender Stockproduzent meist zähneknirschend hinnehmen, wenn sich andere aus meinem großen Bilderfundus mehr oder weniger detailgenau bedienen als Inspirationsquelle.
Das Bild und die Kopie
Manchmal gibt es aber Motive, auf die unser Team besonders stolz ist, weil sie eben noch nicht hundertfach vorhanden sind, vor allem, wenn diese sich dann auch noch sehr gut verkaufen.
Als Beispiel hier dieses 3D-Rendering meines 3D-Grafikers von einem schwebenden Sofa, seit November 2015 im Adobe Stock Portfolio (damals noch Fotolia):
Ich rieb mir nicht schlecht die Augen, als ich im Februar 2020 im Adobe Stock Portfolio des Fotografen Rafael Classen dieses Bild sah:
Es ist das gleiche Sofa, die gleiche Topfpflanze, der gleiche Beistelltisch, und die gleiche Korkenlampe. Selbst die Kissen, welche beim Sofa (ein 3D-Modell der Firma Evermotion, u.a. aus diesem Set) brav auf dem Sofa platziert waren, wurden in fast identischer Kombination genutzt. Auch die Farbwahl ist sehr ähnlich, die Gemeinsamkeiten beider Bilder sind auf den ersten Blick größer als die Unterschiede.
Das Bild von Classen unterscheidet sich in marginalen Details: Der Fußboden ist zum Beispiel dunkler mit anderem Muster, die Fernbedienung ist ein anderes Modell und das Bild hat weniger Vignettierung und ein anderes Seitenverhältnis.
Herr Classen hatte schon vorher einige Bilder in seinem Portfolio, welche meinen Bildern (und denen anderer Kollegen) meiner Ansicht nach auffällig ähnlich sahen, aber hier wollte ich doch eine Grenze ziehen.
Ich meldete die Kopie via DMCA-Formular an Adobe Stock, welche diese daraufhin sperrte, bis der Anbieter Widerspruch einlegte. Nach den Regeln von Adobe müsste ich nun nachweisen, dass meine Meldung rechtlich nachvollziehbar sei, sonst würde die Kopie wieder in den Verkauf kommen.
Also forderte ich durch meinen Anwalt in einer Abmahnung die Abgabe einer Unterlassungserklärung, was Classen ablehnte. Daraufhin reichten wir im April 2020 Klage wegen Urheberrechtsverletzung ein.
Kurz darauf reichte Classen eine Widerklage gegen mich wegen Urheberrechtsverletzung ein, weil er der Ansicht war, ich hätte fünf seiner Bilder kopiert.
Die Gerichtsentscheidungen: 1. LG München
Vor dem Landgericht München wurde unsere Klage (und auch die Widerklage) im Dezember 2021 abgewiesen. Hauptsächlich mit der Begründung, alle Werke seien nicht durch das Urheberrecht geschützt, weil es nach §72 UrhG weder ein Lichtbild (aka „Foto) noch ein Werk nach §2 UrhG sei:
„Inwiefern ein lichtbildähnlicher Schutz auch für Computerbilder bzw. Computeranimationen sowie mit Hilfe der Digitaltechnik veränderte oder neukomponierte Bilder gewährt wird, ist umstritten (Dreier/Schulze, UrhG, 6. Aufl., § 72, Rn. 7, 8 m.w.N.; verneinend KG, GRUR 2020, 280). Ausgangspunkt der vorzunehmenden Auslegung des § 72 UrhG ist der Wortlaut der Norm, wonach maßgeblich auf den Schaffensvorgang und nicht auf das Ergebnis des Schaffensprozesses abgestellt wird. Dementsprechend kann für die Beantwortung der Frage, was unter „Erzeugnissen, die ähnlich wie Lichtbilder hergestellt werden“ zu verstehen ist. allein das Ergebnis des Herstellungsverfahrens letztlich nicht maßgeblich sein. Erforderlich ist nach dem Wortlaut der Norm vielmehr, dass ein ähnliches Herstellungsverfahren wie bei der Erstellung von Lichtbildern angewandt wird. Insoweit kommt es jedoch nicht entscheidend auf den Schaffensvorgang aus Sicht des Anwenders der Technik, sondern auf die Vergleichbarkeit der technischen Prozesse an. Für die Ähnlichkeit der Prozesse spricht, dass bei der Erstellung einer Computergrafik auch Gegenstände zunächst räumlich in ganz bestimmter Weise zueinander angeordnet, eine bestimmte Farbwahl getroffen und sodann gegebenenfalls über Art, Anzahl und Position der Lichtquellen entschieden wird. Dies genügt jedoch nicht, um von einem lichtbildähnlichen Erzeugnis auszugehen. Zentrales Argument für die Privilegierung der Lichtbilder war der Einsatz der Technik der Fotografie. Im Fokus steht dabei die technische und nicht die schöpferische Leistung. Charakteristische Merkmale der Fotografie sind aber zum einen der Einsatz von strahlender Energie und zum anderen die Abbildung eines im Moment der Bilderschaffung vorhandenen, körperlichen Gegenstands (OLG Köln, GRUR-RR 2010, 141, 142; KG, GRUR 2020, 280, 284; BeckOK UrhR/Lauber-Rönsberg, 32. Ed. 15.9.2021 , UrhG, § 72, Rn. 33).
Beide Merkmale erfüllt das streitgegenständliche Rendering indes nicht. Es handelt sich hierbei gerade nicht um eine unter Einsatz strahlender Energie erzeugte selbstständige Abbildung der Wirklichkeit, sondern vielmehr um eine mittels elektronischer Befehle erzeugte Abbildung von virtuellen Gegenständen.“
aus dem Urteil des LG München vom 3.12.2021
Angesichts der modernen Technik, die schon jahrzehntelang Einzug in die Bildproduktion gehalten hatte, wollten wir nicht so recht glauben, dass wir keine Urheberrechte an unserem Bild hätten, nur weil es kein Foto, sondern ein 3D-Rendering sei.
Deshalb legten wir Berufung gegen das Urteil ein. Auch Rafael Classen legte Berufung wegen seiner abgewiesenen Widerklage ein.
2. OLG München
Wie wir gehofft hatten, betrachtete das Oberlandgericht München den Fall differenzierter und fällte am 29.6.2023 ein Urteil zu unseren Gunsten (OLG München, Aktenzeichen 29 U 256/22).
Erstens wurde anerkannt, dass auch 3D-Renderings Urheberschutz genießen können, wenn sie eine gewisse künstlerische Leistung erkennen lassen. Ausführlicher wird dieser Aspekt in diesem Blogpost auf der Webseite meines Anwalts zitiert.
Zweitens legt das OLG München ausführlich dar, unter welchen Bedingungen nicht nur direkte Kopien eines Originals, sondern auch Varianten davon schutzfähig sein können:
„[…] Ist die Veränderung der benutzten Vorlage indessen so weitreichend, dass die Nachbildung über eine eigene schöpferische Ausdruckskraft verfügt und die entlehnten eigenpersönlichen Züge des Originals angesichts der Eigenart der Nachbildung verblassen, liegt keine Bearbeitung oder andere Umgestaltung i.S.d. § 23 Abs. 1 Satz 1 UrhG […], sondern ein selbstständiges Werk vor, das in freier Benutzung des Werks eines anderen geschaffen worden ist und das […] ohne Zustimmung des Urhebers des benutzten Werks veröffentlicht und verwertet werden darf.“
Genau diese Bedingung sei in unserem Fall aber nicht erfüllt worden:
„Bei einem Vergleich des Gesamteindrucks der beiden Gestaltungen zeigt sich, dass dieser auch im Rendering des Beklagten durch ebendiese Elemente, das impulsbedingte Abheben, die Wellenform, den Hintergrundkontrast und – in etwas geringerem Maße – durch den Schattenwurf bestimmt werden. Gerade die wellenförmige Ausrichtung der Einzelelemente mit ihren einzelnen Drehrichtungen und Neigungswinkeln ist praktisch identisch zum klägerischen Rendering und erzeugt in gleicher Weise den Eindruck eines kurz nach dem Abheben der Dinge erfolgten Schnappschusses, wobei auch der Kontrast der größtenteils hellen Elemente vor einem ähnlichen Blauton im Hintergrund die Wirkung verstärkt. Die Unterschiede der Gestaltungen, die vor allem durch einen dunkleren Boden mit stärkerer Zeichnung der Bohlen sowie den sich stärker auf der Wand als auf dem Boden abzeichnenden Schattenwurf bestimmt werden, prägen den Gesamteindruck beim Rendering der Beklagten dagegen nicht so nachdrücklich, dass die sich aufdrängenden und ins Auge stechenden Übereinstimmungen in ihrer Gesamtwirkung verblassen würden. Da durch den stark übereinstimmenden Gesamteindruck beider Renderings die ursprüngliche klägerische Gestaltung beim Rendering des Beklagten deutlich wiederzuerkennen ist, greift dessen Gestaltung in den Schutzbereich des älteren klägerischen Werkes ein.“
3. Die Widerklage
Rafael Classen behauptet in seiner Widerklage, ich hätte mit diesen fünf Werken seine Urheberrechte verletzt, weil er fast identische Bilder vorher erstellt hätte:
Bei den beiden gelben 3D-Renderings mit den Icons an der Wand lehnte das Oberlandgericht München die Berufung der Widerklage mit Verweis auf die zu geringe Schöpfungshöhe ab:
„Bezüglich der Renderings des Beklagten […] ist dem Landgericht darin zu folgen, dass diese nicht die nötige Gestaltungshöhe im Sinne von § 2 Abs. 2 UrhG aufweisen und daher keinen Werkschutz im Sinne von § 2 Abs. 1 Nr. 4 oder Nr. 5 UrhG genießen.
Es handelt sich jeweils um im Schriftverkehr übliche Zeichen in einer üblichen Schrifttype, die im weitesten Sinne mit Kommunikation zu tun haben, wofür wiederum die Wahl der Farbe Gelb und des konkreten Farbtons wegen der Assoziation zu Postdienstleistungen besonders naheliegend erscheint. Der durch das Anlehnen an einer Wand, den Schattenwurf und die Spiegelung auf dem Boden entstehende räumliche Eindruck ist ebenfalls im Bereich von Logos und in der Werbegrafik hinlänglich geläufig und hebt die beiden Gestaltungen nicht vom Alltäglichen und handwerklich Üblichen ab.“
Bei den drei Fotos der Kölner Messe sei zwar die Schöpfungshöhe erreicht, aber unberechtigte Kopien seien meine Fotos nicht:
„Auch sofern man in den Aufnahmen des Beklagten bloße Lichtbilder nach § 72 UrhG erblicken würde, fehlte es an einer Verletzung, da diese nach dem oben Gesagten keinen Motivschutz gegen nichtidentische oder nicht nahezu identische Gestaltungen genießen, so dass es sogar jedermann freisteht, das gleiche vorgegebene Motiv vom selben Standort und unter denselben Lichtverhältnissen noch einmal aufzunehmen.“
Richtungsweisende Entscheidung
Mit dem Urteil des OLG München haben wir nun die erste Entscheidung seit langem, die sich ausführlich mit dem Motivschutz von 3D-Renderings und Fotos befasst.
Ob Motive nachgestellt werden dürfen, hängt demnach von vielen Faktoren ab, die im Einzelfall geprüft werden müssen. Eine Urheberrechtsverletzung liegt in der Regel dann vor, wenn die den Gesamteindruck prägenden Gestaltungselemente des Originals auch in der Kopie vorliegen.
Weitere Termine
Auch wenn diese Klage erledigt ist, gibt es weitere Gerichtstermine mit Herr Classen. Am Mittwoch, den 8.5.2024 findet vor dem Landgericht Düsseldorf der Gütetermin und Verhandlungstermin wegen „Folgeansprüchen aus Wettbewerbsrechtsverletzung durch Veröffentlichungen eines Mitbewerbers und datenschutzrechtlicher Auskunft“. Die Einstweilige Verfügung in diesem Zusammenhang hat er bisher größtenteils verloren, insofern bin ich auch da zuversichtlich.
Im Verlag Klaus Wagenbach gibt es seit 2019 mit „Digitale Bildkulturen“ die erste Buchreihe, welche sich systematisch mit digitalen Bildphänomenen beschäftigt.
Das reicht von „Cat Content“ über „TikToK“ und „Videokunst“ bis zur Stockfotografie*. Letzteres Buch mit Thomas Nolte als Autor ist vor einer Woche erschienen (ISBN 978–3803137418). Ich habe es mir für euch angeschaut.
Das Buch ist wie alle Ausgaben der Reihe recht klein (ich habe zum Vergleich mal meine Hand im Bild gelassen) und mit 80 Seiten auch recht dünn.
Wenn da noch die Anmerkungen und das Abbildungsverzeichnis weggelassen werden, bleiben netto ca. 55 Seiten, in denen Thomas Nolte zeigen will, „dass sich aus dem Geschäftsmodell der Stockfotografie eine eigene unverwechselbare Ästhetik ergibt“ (S. 10–11).
Gedanklich teilt sich das Buch grob in drei Abschnitte. Erstens die Entstehung der Stockfotografie, welche sich mit der Kapitelüberschrift „Stockfotografie als Adoptivkind des Neoliberalismus“ gut zusammenfassen lässt.
Drittens der Zuarbeit der Stockfotografie-Branche für die aufkommenden KI-Unternehmen:
„Der Eintritt der Stockfotografie in die digitale Sphäre geht dabei nicht spurlos an ihr vorüber. Vielmehr wird sie von der Dynamik des Internets erfasst: So treiben die Sozialen Medien mit den klischeehaften Darstellungen der Stockfotografie ihren Schabernack, und Unternehmen machen sich die digitalisierten Bilddatenbanken der Stockfotografie zunutze, um ihre künstlichen Intelligenzen (KI) zu trainieren. Damit nehmen Stockfotos in der digitalen Bildkultur eine Scharnierfunktion ein: Sie dienen als Grundlage für eine gerade erst anbrechende Ära von KI-generierten Bildern, in denen sich die Ästhetik der Stockfotografie fortsetzt, ja vielleicht sogar prägend wird.“ (S. 11)
Solche prägnanten Zusammenfassungen der Stockfotografie-Entwicklung gibt es einige im Buch. Zur Kommerzialisierung heißt es zum Beispiel:
„Die Einbindung der Microstockfotografie führte zu den schon häufiger beschriebenen Effekten des Plattformkapitalismus: Die Produktionskosten werden auf die Produzent*innen abgewälzt, wodurch sich die Preise für die Kund*innen senken lassen. Den Hauptteil der Gewinne streichen die Plattformbetreiber ein, während die Produzent*innen nur noch in Ausnahmefällen von ihrer Arbeit leben können.“ (S. 18)
Interessant ist meiner Ansicht nach auch die Erwiderung im Buch auf den häufigen Vorwurf, Stockfotos würden die mit ihrer Darstellung die Gesellschaft beeinflussen. Laut Nolte bieten Stockfotos vielmehr eine Vielzahl an möglichen Gesellschaftsentwürfen an, aus denen sich die Käufer dann ihre bevorzugte Version aussuchen:
„Dadurch machen Stockfotos sichtbar, was eine Gesellschaft als „normal“ betrachtet.“ (S. 42)
Die Diskussionen um den negativen Einfluss der KI auf die Stockfotobranche sind im Buch kurz und knackig zusammengefasst und mit etwas Mühe kann trotzdem sogar ein kleiner Hoffnungsschimmer herausgelesen werden:
„Ein Alleinstellungsmerkmal der Stockfotografie ist, dass sie immer wieder neue Bildformeln entwickelt, mit denen sie auf gegenwärtige Ereignisse verweist. Zwar lässt sich ein Bild wie das des auf dem Heizkörper stehenden Sparschweins ohne Probleme mit einem Bildgenerator erstellen, die konzeptionelle Idee hierfür bedarf aber weiterhin der menschlichen Erfindung. Eine Überlebenschance der Stockfotografie liegt also in ihrer konzeptionellen Arbeit.“ (S. 61)
Hier unterschätzt der Autor jedoch vielleicht die Entwicklungen auf dem Gebiet der generativen Text-KIs. Als Beispiel habe ich einfach mal ChatGPT gefragt, wie das im Buch aufgegriffene Thema „Energiekrise“ visuell konzeptionell umgesetzt werden könnte.
Abgesehen davon liefert das Buch einen kurzen Überblick über den geschichtlichen Werdegang der Stockfotografie mitsamt einer gesellschaftlichen, wirtschaftlichen und technologischen Einordnung.
Stockfotograf*innen werden im Buch sicher keine konkreten Handlungsempfehlungen finden, aber in der Lage sein, über ihre berufliche Position etwas zu reflektieren.
Dies ist jetzt schon die achte Auswertung meiner jährlichen Umfrage unter meinen Leser*innen, welche Agenturen ihnen im Vorjahr, also diesmal 2023, den meisten Umsatz gebracht haben. Die Agenturen sollten sie nach Umsatz absteigend sortiert als Kommentar hinterlassen. Zusammen mit mir haben sich 38 Fotograf*innen beteiligt. Leider weniger als in den Vorjahren, aber trotzdem vielen Dank dafür!
Die Ergebnisse will ich euch hier gerne vorstellen. Zuerst die eindeutige Grafik (Klick zum Vergrößern):
Meine Vorgehensweise: Ich habe in einer Excel-Tabelle eine Liste gemacht und in die erste Spalte jede Agentur eingetragen, die genannt wurde. In den nächsten Spalten habe ich dann für jede Teilnehmer*in und jede Agentur Punkte vergeben, basierend auf der Sortierung der genannten Agenturen. Die erste Agentur, also die mit dem meisten Umsatz, bekam 10 Punkte, die als zweites genannte Agentur bekam 9 Punkte und so weiter. Die Werte habe ich pro Agentur summiert und die Liste dann nach den Punkten sortiert. Das Ergebnis seht ihr oben, die Zahl in Klammern ist also die Gesamtpunktzahl der jeweiligen Agentur. Insgesamt wurden 33 verschiedene Agenturen benannt, ich habe die Liste jedoch auf die ersten 15 Agenturen beschränkt, weil das statistische Rauschen zum Ende hin mit meist nur einer Nennung sehr viel größer ist.
Hinweise: Bei der Umfrage wurde nicht unterschieden, ob die Leute Videos oder Fotos oder beides verkaufen, wie viele Dateien sie online haben oder seit wann sie dort hochladen. In der letzten Klammer sehr ihr die Veränderung zum Vorjahr.
In der Liste oben sind iStock und Getty zwar getrennt aufgeführt, ganz trennscharf lassen sich diese jedoch nicht auseinanderhalten, da iStock ja auch über Getty Images verkauft und beide Agenturen zusammengehören. Aber selbst wenn ich Getty zu iStock addiert hätte, hätte sich an der Platzierung von iStock auf dem dritten Platz nicht geändert, dafür wäre hinten nur Vecteezy als Neueinsteiger auf Platz 15 aufgetaucht, wenn Getty entfallen wäre.
Meine besten Agenturen 2023 Wer die obige Liste nachrechnen oder anders auswerten will, kann das ebenfalls machen, meine Datenbasis ist frei einsehbar, nur ein Teilnehmer hat mir seine Daten per Direktnachricht geschickt.
Was jedoch noch fehlt, sind die Agenturen, bei denen ich selbst 2023 am meisten Umsatz erzielt habe und die ich ebenfalls in obige Rechnung habe einfließen lassen. In Klammern wieder die Veränderung zum Vorjahr:
Adobe Stock (-)
Shutterstock (-)
Canva (-)
123rf (-)
Zoonar (-)
Dreamstime (+1)
Alamy (+1)
EyeEm (-2)
Pond5 (-)
Westend61 (-)
Was sagt uns diese Auswertung?
Adobe Stock hat seine Spitzenposition im Vergleich zu den Vorjahren noch weiter ausgebaut, Shutterstock bleibt jedoch – mit gebührendem Abstand – weiterhin stabil auf dem zweiten Platz.
iStock führt das Mittelfeld an, in dem sich noch Dreamstime, Alamy und Depositphotos tummeln. Die restlichen Agenturen sind kaum noch der Rede wert. Diese Formulierung fand sich auch häufig in den Kommentaren der Teilnehmer.
Den größten Abstieg musste EyeEm erleiden, was sehr wahrscheinlich direkt mit deren Insolvenz letztes Jahr zusammenhängt. Am stärksten aufgestiegen ist Pond5, wobei ich hier nicht erkennen kann, woran das liegen könnte.
Die Beteiligung dieses Jahr war leider auch deutlich geringer, was die Datenqualität natürlich etwas leiden lässt.
Habt ihr die Ergebnisse erwartet? Oder sind Überraschungen für euch dabei?
Seit Tagen ist in der KI-Welt kaum von etwas anderem die Rede als den beeindruckenden Ergebnissen von Sora.
Sora ist der Name des kürzlich hier vorgestellten Text2Video-Generators der Firma OpenAI, welche auch schon den Text2Bild-Generator Dall‑E und das Text2Text-Generator ChatGPT veröffentlicht hat.
Mit Sora können durch simple Texteingaben hochauflösende Videos von bis zu einer Minute Länge generiert werden.
Einen Überblick über die Ergebnisse findet ihr haufenweise, entweder auf der Sora-Seite direkt oder bei YouTube, zum Beispiel in diesem Video:
Auf der offiziellen Webseite wird lang und breit über die Sicherheit des Tools geredet und gerne erwähnt, dass geplant sei, den C2PA-Metadaten-Standard zur Erkennung von KI-generierten Inhalten zu unterstützen. Auffällig ist aber, dass andere Informationen fehlen.
Das Geheimnis der Trainingsdaten
Auffällig ist, dass an keiner Stelle der Vorstellung von Sora darauf eingegangen wird, wie genau das KI-Tool trainiert wurde. Welche Daten wurden dafür verwendet?
Im technischen Report findet sich nur der lapidare Satz: “[…] we train text-conditional diffusion models jointly on videos and images of variable durations, resolutions and aspect ratios.“
Ach? Ja, das war uns allen klar, aber welche Videos und Bilder habt ihr dafür nun genau benutzt?
In der Vergangenheit hat sich OpenAI nicht mit Ruhm bekleckert, wenn es um Rücksicht auf Urheberrechte bei Trainingsdaten ging.
Auch beim zweiten Produkt von OpenAI, ChatGPT, liegt die Sache ähnlich. OpenAI wird gerade von der Zeitung New York Times verklagt, weil urheberrechtlich geschützte Trainingsdaten der Zeitung für das KI-Training von ChatGPT benutzt worden seien.
Bei einer Zeugenanhörung von OpenAI durch das Oberhaus des britischen Parlaments fiel seitens OpenAI auch der folgenschwere Satz:
„Because copyright today covers virtually every sort of human expression–including blog posts, photographs, forum posts, scraps of software code, and government documents–it would be impossible to train today’s leading AI models without using copyrighted materials. Limiting training data to public domain books and drawings created more than a century ago might yield an interesting experiment, but would not provide AI systems that meet the needs of today’s citizens“
Frei übersetzt: Ohne den Zugriff auf urheberrechtlich geschützte Trainingsdaten könnten wir unsere Tools nicht anbieten.
Genau wegen diesem bisher schon bekannten rücksichtslosen Umgang mit Urheberrechten muss eine Frage viel lauter gestellt werden:
Welche Videos und Bilder wurden für das Training der Sora-KI verwendet?
Die Wahrscheinlichkeit ist sehr hoch, dass auch hier – ähnlich wie beim Training von Dall‑E und ChatGPT urheberrechtlich geschützte Videos (und Bilder) zum Einsatz kamen.
Selbst Wasserzeichen in Videos sind für KI-Entwickler schon lange kein Hindernis mehr. Schon 2017 hat Google selbst eine Technik vorgestellt, mit der Wasserzeichen aus Bildern entfernt werden können.
Auch der LAION-Verein bietet auf GitHub ein kostenloses Tool für die „Wasserzeichen-Erkennung“ an. Von der Erkennung zur Entfernung ist es für geübte Programmierer dann nur noch ein kleiner Schritt, über den aus rechtlichen Gründen nicht so gerne öffentlich geredet wird. Manchmal aber doch:
Bei LAION wird zwar an einem eigenen Text2Video-Generator namens phenaki gearbeitet, die technischen Details des Trainings sind denen von Sora aber sehr ähnlich, soweit ich das beurteilen kann.
Die Wahrscheinlichkeit, dass OpenAI daher mit der gleichen Rücksichtslosigkeit wie LAION gegenüber Urhebern beim KI-Training vorgeht, halte ich für hoch, zumal die bisherigen Aussagen und Handlungen von OpenAI leider nicht geeignet sind, Zweifel zu zerstreuen.
Beim ganzen Hype vom SORA und dem Staunen über die tollen Ergebnisse sollte nicht vergessen werden zu fragen, welche (Video-)Künstler beim Training beteiligt waren.