Einführung
Künstliche Intelligenz revolutioniert die Archivarbeit, besonders in Bildarchiven, grundlegend. Die Bilderschließung ist eine zeitaufwändige und manuelle Aufgabe, bei der Menschen jedes Bild betrachten und beschreiben müssen. Mit der Einführung von KI-Technologien hat sich dieser Prozess erheblich verbessert und beschleunigt. 1
Was bedeutet „Künstliche Intelligenz“?
Was ist ein neuronales Netz?
Unter einem neuronalen Netz versteht man ein grundlegendes Konzept der künstlichen Intelligenz, welches speziell zum Bereich des maschinellen Lernens gehört. Es ist ein Rechenmodell, das sich an der Struktur und Funktionsweise des menschlichen Gehirns orientiert. Neuronale Netze bestehen aus vielen miteinander verbundenen „Neuronen“ (Recheneinheiten), welche die Nervenzellen im Gehirn nachahmen. Mithilfe von Algorithmen können sie Informationen verarbeiten und daraus Ergebnisse ableiten. 2
Funktionsweise KI-gestützter Bilderschließung
Die KI-generierte Bilderschließung basiert auf Algorithmen, die Bildinhalte analysieren und automatische Schlagwörter, so genannte Tags, vergeben können. Damit dies funktionieren kann braucht das neuronale Netz einen Dateninput, mit dem es selbstständig lernen kann. In diesem Input sind rund 500 bis 1000 repräsentative Bilder eines Objektes notwendig, damit die Software trainiert werden kann dieses Objekt in einem Bild erkennen und verschlagworten zu können. 3 4
Dieser Prozess wird als Deep Learning bezeichnet. Ein neuronales Netz wird dabei darauf trainiert, Muster und Merkmale in Daten zu erkennen, wie in diesem Fall anhand des Bildes einer Katze (Abbildung 1). Dieses Bild dient als Trainingsinput, um dem Algorithmus das Konzept „Katze“ anhand von charakteristischen Merkmalen wie Fell, Schnurrhaaren und Ohren zu vermitteln. Die grundlegenden Merkmale des Konzepts „Katze“ werden im neuronalen Netz gespeichert, sodass auch die hier abgebildete, schlafende Katze (Abbildung 2) als „Katze“ erkannt werden kann. Obwohl sie sich in der Körperhaltung unterscheidet, bleiben die allgemeinen Merkmale wie Fellstruktur, Kopf- und Ohrenform konsistent und ermöglichen die richtige Kategorisierung.
Vorteile von Künstlicher Intelligenz in der Archivarbeit
Der Einsatz von künstlicher Intelligenz in der Archivarbeit bringt einige Vorteile mit sich. Während die Erkennung und Kategorisierung von Bilddokumenten in historischen Archiven sehr zeitaufwendig ist schafft es die KI in kurzer Zeit und mit hoher Präzision eine Vielzahl von Bildern inhaltlich zu erschließen. Beim Verschlagworten wird das zentrale Motiv erfasst, während automatisierte Tags die Bilder detaillierter beschreiben können. 1 3
Technische und ethische Herausforderungen von künstlicher Intelligenz in der Archivarbeit
Trotz der Vorteile bleiben technische und ethische Herausforderungen bestehen, die hauptsächlich mit dem Training des neuronalen Netzes in Verbindung stehen. Die künstliche Intelligenz muss variable Beleuchtungsverhältnisse, unklare Bilder und komplexe Szenen erkennen und korrekt einordnen können. Außerdem müssen die Trainingsdaten so vielfältig und repräsentativ sein, dass sie den ethischen Richtlinien folgen. Beispielsweise in Bezug auf Datenschutz oder die Vermeidung von kognitiven Verzerrungen (Bias).1 Die Trainingsdaten müssen Minderheiten und unterrepräsentierte Gruppen korrekt verschlagwortet werden können, da sonst die Gefahr besteht, dass das Modell Vorurteile reproduziert oder ungenau und fehlerhaft klassifiziert.
Ausblick
Die Aufgabe der künstlichen Intelligenz in der Bilderschließung ist sowohl als Ergänzung der intellektuellen Arbeit des Menschen zu sehen, als auch als Mittel zur Reduzierung von Fehlern, die bei manueller Analyse auftreten können. Sie ermöglicht eine schnellere und präzisere Erfassung großer Mengen an Bildmaterial. Ein geeigneter Weg, um die Hilfe von KI-Technologie in Zukunft effizient einzusetzen wird möglicherweise der Kompromiss aus manueller Verschlagwortung und KI-generierter Erschließung sein. Trotz der Herausforderungen, die es zu bewältigen gibt, werden der Fortschritt und die Leistungsfähigkeit, die mit dem Einsatz und der Entwicklung von neuronalen Netzen einhergehen die Möglichkeiten der Archivarbeit vielfältig bereichern, angefangen im Bereich der Bilderschließung. 1 3
Weitere Artikel zu diesem Thema:
Quellen
- 1 Digitales Institut (2023): Verständnis der künstlichen Intelligenz in der Bilderkennung. Online unter: KI für Bilder: Wie künstliche Intelligenz die Bilderkennung revolutioniert – Digitales Institut (digitales-institut.de)
- 2 Studiflix (2025): Neuronale Netze. Online unter: Neuronale Netze • Was ist ein neuronales Netz? · [mit Video]
- 3 O-Bib – das offene Bibliotheksjournal (2023): Alles unter Kontrolle? KI im Einsatz im Bildarchiv der ETH-Bibliothek. Bd. 10/2 (2023). Online unter: Anzeige von Bd. 10 Nr. 2 (2023) (o-bib.de)
- 4 Sax Archiv Blog – Neues aus dem sächsischen Staatsarchiv (2024): Künstliche Intelligenz: Auch was für Archive! Online unter: Künstliche Intelligenz: Auch was für Archive! – SAXARCHIV-Blog
- 5 Schmid, Josef: Katze, 2/1973. Bildnachweis: ETH-Bibliothek Zürich, Bildarchiv, http://doi.org/10.3932/ethz-a-001002487
- 6 Schmid, Josef: Katze beim Schlafen, 2/1973. Bildnachweis: ETH-Bibliothek Zürich, Bildarchiv, http://doi.org/10.3932/ethz-a-001002485