Quelle für Materialien auf dieser Seite: IT2School (veröffentlicht unter CC-BY-NC-SA-Lizenz)
Um genauer zu untersuchen, wie eine Künstliche Intelligenz Bilder erkennen kann, sehen wir uns folgendes Beispiel an:
Gesichtsausdrücke von Affen
Genau wie wir Menschen haben Affen verschiedene Gesichtsausdrücke. Teilweise sind sie sehr ähnlich zu unseren menschlichen Gesichtsausdrücken, teilweise unterscheiden sie sich auch. In diesem kurzen Video kannst du ein paar Gesichtsausdrücke eines Gorillas sehen:
Wir versuchen jetzt folgendes Problem mit KI zu lösen: Die KI soll am Gesichtsausdruck des Affen erkennen, welche Stimmung der Affe hat.
Damit es nicht so kompliziert wird, vereinfachen wir das Problem in diesem Beispiel. Das hat natürlich mit der Realität nicht mehr viel zu tun, zeigt aber gut, wie KI arbeitet.
In diesem Arbeitsblatt geht es jetzt darum herauszufinden, welche der Affen beißen und welche nicht. Beschäftigte dich mit dem Blatt. Wenn du fertig bist, kannst du mit der Lösung vergleichen.
Auf dem Arbeitsblatt hast du einen Entscheidungsbaum erstellt. Eine KI ist so programmiert, dass sie Entscheidungsbäume selbstständig erstellt. So können auch komplexe Bilder analysiert werden.
Neuronale Netze
In unserem Beispiel hatten die Affen ganz klar erkennbare Eigenschaften, zum Beispiel ein X als Auge. Damit konnten wir leicht eine Klasse bilden und die Affen unterscheiden. In der Realität geht das nicht so einfach. Bei der Verarbeitung muss das Bild erst vereinfacht werden. Dafür nutzt man Filter. Jeder Filter macht das Bild einfacher.
Probiere es selbst aus. Lade dir das Bild auf dein Gerät und versuche es mit den vorhandenen Filtern zu vereinfachen. Auf einem iPad geht das mit der Schaltfläche „Bearbeiten“ oben rechts in der Galerie-Ansicht.
Quelle: Jose Almeida/pexels.com
Die Ergebnisse könnten zum Beispiel so aussehen:
Diese vereinfachten Bilder werden von der KI jetzt analysiert. Das passiert ganz ähnlich wie mit den Beispiel-Affen für die wir einen Entscheidungsbaum aufgestellt haben. Für jeden einzelnen Filter erstellt die KI einen eigenen Entscheidungsbaum aus den Trainingsdaten. Alle Daten werden dann in einem neuronalen Netz zusammengefügt, sodass am Ende zuverlässig ein Bild erkannt werden kann. Vereinfacht kann man sich das so vorstellen:
Mit dem Klicken auf das Video erklärst du dich damit einverstanden, dass Inhalte von YouTube angezeigt werden. Dabei werden Daten an Google übertragen.