CSR_NEWS Digitalwirtschaft Künstliche Intelligenz

Privates in KI-Trainingsdaten

Foto: Pexels

BR analysiert LAION

München (csr-news) – Bei der Analyse von Trainingsdaten für KI-Systeme fand der BR das Nacktbild eines Niederländers, wobei die Bildbeschreibung den Vor- und Nachnamen des Betroffenen sowie den Aufnahmeort offenbarten. Analysiert hatten die BR-Datenjournalistinnen den weltweit wohl umfassendsten Trainingsdatensatz für die KI-Bildgenerierung, LAION5B. Das „Large-scale Artificial Intelligence Open Network“ bietet fünf Milliarden Links auf Bilder und ihre Beschreibungen im Internet.

LAION ist ein deutscher gemeinnütziger Verein, der KI-Modelle und -Datensätze nach Open Source-Standards entwickelt. „Wir haben LAION aus Begeisterung für diese KI-Technologie gegründet und dem Wunsch, dass das demokratisiert wird und es am Ende nicht nur zwei, drei großen Firmen gibt“, sagte LAION-Vorstand Christoph Schuhmann dem BR. Anders als die For-Profit-Akteure Google, Microsoft, Midjourney und OpenAI setzt LAION auf radikale Transparenz – was die BR-Recherche ermöglichte. Diese fand im deutschsprachigen Teil der LAION-Datensätze im sogenannten Exif-Format gespeicherte Metadaten, die Rückschlüsse z.B. auf das Aufnahmedatum und den Aufnahmeort ermöglichen. Zu 310.000 Bildverweisen im deutschsprachigen LAION-Teil konnte der BR den exakte Aufnahmeort ermitteln.

LAION-Vorstand Schumann sagte dem BR, er werde durch die Recherche erstmals auf dieses Problem hingewiesen.


Werden Sie Mitglied im UVG e.V. und gestalten Sie den Nachhaltigkeitsdialog mit. > Die Infos
DSGVO Cookie Consent mit Real Cookie Banner