Alan Turing stellte bereits 1950 in einem seiner Aufsätze die Frage, die heute häufig in die Diskussion um den digitalen Wandel mit einzieht: „Can machines think?“ Er definierte hierbei die künstliche Intelligenz über einen Test, bei dem sich ein menschlicher Fragesteller über ein anonymisiertes Computerterminal mit einem realen Menschen und mit einer Maschine unterhält. Nach einer bestimmten Anzahl an selbst gewählten Fragen muss der Fragesteller entscheiden, bei welchem der gegenüberliegenden Akteure es sich um einen Menschen und bei welchem es sich um eine Maschine handelt. Kann diese Entscheidung nicht eindeutig getroffen werden, so gilt die Maschine nach Turing als intelligent.[1] Neben diesem Praxistest von Turing kann man sich der Frage nach der Intelligenz von Maschinen aber auch theoretisch nähern, indem man die Definitionen und Funktionen der menschlichen Intelligenz und der künstlichen Intelligenz gegenüberstellt.
Theorien zur menschlichen Intelligenz
Es gibt nicht die allgemeingültige Theorie zu Intelligenz. Mit Intelligenz ist ganz allgemein die kognitive Leistungsfähigkeit gemeint. In diesem Beitrag beschränken wir uns auf die kurze Beschreibung einer faktoriellen und einer multifaktoriellen Theorie.
Charles Spearman, ein britischer Psychologe, definierte den g-Faktor – die generelle Intelligenz als Grundlage aller weiteren spezifischen Intelligenzfaktoren. Die Leistung in einem z.B. mathematischen Test ist das Ergebnis aus dem Zusammenwirken des generellen Intelligenzfaktors und des spezifischen Intelligenzfaktors für mathematische Problemstellungen.[2] Raymond B. Cattell entwickelte den g-Faktor weiter; er postulierte, dass der g-Faktor aus zwei Faktoren besteht: die fluide Intelligenz, das sind angeborene Fähigkeiten, und kristalline Intelligenz, Fähigkeiten, die aus der Umwelt erworben werden.[3] Der Psychologe J.P. Guilford wiederum verneinte die Existenz des g-Faktors, für ihn wurde Intelligenz aus 150 spezifischen Fähigkeiten zusammengesetzt.[4] In der Literatur finden sich einige weitere Modelle, auch die Zusammenführung von verschiedenen Modellen.
Künstliche Intelligenz
Bei der Definition der künstlichen Intelligenz müssen verschiedene Ausprägungsstufen berücksichtigt werden. So unterscheidet man zwischen schwacher und starker künstlicher Intelligenz. Die schwache künstliche Intelligenz umfasst Modelle und Algorithmen für die Lösung begrenzter und vorher eng definierter Problemstellungen, während es sich bei starker künstlicher Intelligenz um eine Nachahmung des menschlichen Gehirns handelt.[5] Ein Beispiel für eine schwache künstliche Intelligenz wäre ein Schachcomputer oder der Kommunikationsassistent ‚Alexa‘ der Firma Amazon, der Sprache analysiert und darauf eine passende Reaktion berechnet. Künstliche Intelligenz ‚lernt‘ hierbei maschinell, indem man dem Programm verschiedene gelabelte Daten bereitstellt. Diese Daten werden durch Lernalgorithmen analysiert. Hierdurch wird ein mathematisches Modell berechnet und angewendet, das für neue Daten eine passende Reaktion oder Vorhersage berechnet, welche dann als Grundlage für das weitere Verhalten der jeweiligen künstlichen Intelligenz dient.[6] Die Verwendung dieser Lernalgorithmen in Kombination mit einer großen Menge verschiedener Daten erfordert ein komplexes Zusammenspiel von Hard- und Software-Lösungen. Vor allem die Entwicklung der Hardware für künstliche Intelligenz hat in den letzten Jahren zu einem starken Anstieg der Anwendungen in diesem Bereich geführt.[7]
Will man Cattels Faktorenmodell für einen Vergleich heranziehen, dann zeigt das eben beschriebene Zusammenspiel von Hard- und Software, dass auch bei der künstlichen Intelligenz eine gewisse fluide Intelligenz eine wichtige Rolle spielt. So hängen die Ergebnisse der künstlichen Intelligenz von den vorherbestimmten Eigenschaften, wie der spezifischen Hardware und somit Rechenleistung, aber auch von dem verwendeten Lernalgorithmus ab. Diese Zusammensetzung bestimmt somit maßgeblich mit, wie sich die künstliche Intelligenz im eigentlichen Lernprozess einem bestimmten Problem annähern und dieses verstehen kann.
Maschinelles Lernen / Deep Learning
Eine wichtige Methode des maschinellen Lernens im Gebiet der künstlichen Intelligenz ist das Deep Learning.[8] Die Basis hierfür sind künstliche neuronale Netze, welche den gleichen Grundprinzipien der menschlichen Informationsverarbeitung folgen. Zu den grundlegenden Begriffen aus der Neurophysiologie gibt es einen gesonderten Blog Beitrag („Neuronale Netze und die Hebbsche Lernregel“).
Diese neuronalen Netze werden hierbei häufig auf ganz bestimmte Erkennungsobjekte trainiert. Z.B. analysiert die Maschine Bilder mit Fußgängern und baut sich daraus das Wissen auf, wie sie in Zukunft Fußgänger auf unbekannten Bildern erkennen kann. Ein künstliches neuronales Netz besteht aus Neuronen, die unterschiedlich miteinander verknüpft sind. Jedes Neuron verfügt über Eingabekanäle und Ausgabekanäle, durch die es Signale von vorherigen Neuronen annimmt, weiterverarbeitet und an andere Neuronen weitergibt. Die eben beschriebenen Kanäle sind mit Gewichtungen versehen. Diese Gewichtungen werden kumuliert und gegen einen Schwellwert geprüft; ist der Schwellwert überschritten, „feuert“ das Neuron über einen Ausgabekanal an angeschlossene Neuronen in der nächsten Schicht. Mehrere (~deep) Schichten sind hintereinander geschaltet, bis am Ende ein Resultat steht, nämlich das erkannte Motiv.[9]
Die Neuronen und Kanäle eines untrainierten Netzes haben „random“(zufällige) oder initiale Gewichtungen, ihre Werte spielen am Anfang keine Rolle. In der Trainingsphase sind die Eingabedaten kodiert bzw. gelabelt. Das Ergebnis kann dadurch auf Richtigkeit geprüft werden; hier gilt wie annähernd gut das Ergebnis ist. Daraufhin berechnet das Netz nun die Diskrepanz zwischen prognostiziertem Ergebnis in der Ausgabeschicht und dem bereitgestellten Label des Trainingsdatensatzes. Diese Diskrepanz wird auch als Fehlerwert bezeichnet.[10] Je höher der berechnete Fehlerwert, desto schlechter war die Vorhersage des Netzes. Zu dem eigentlichen Lernprozess kommt es dann in der darauffolgenden Backpropagation. Auf Basis des berechneten Fehlerwertes wird das Netz hierbei rückwärts durchlaufen, wobei die verschiedenen Gewichtungen in den verschiedenen Schichten angepasst werden. Diese Gewichtungen werden so verändert, dass sich der Fehlerwert minimiert. [11]
Der Vorgang wird millionenfach mit unterschiedlichen Motiven wiederholt, bis die Erkennungsquote der KI die gewünschte Höhe hat. Ab einem bestimmten Regressionsgrad ist das Netz so gut angepasst, dass es auch für unbekannte Daten ausreichend gute Vorhersagen gibt.[12]
Die eben beschriebenen Sachverhalte zeigen, dass man das Deep Learning mit der kristallinen Intelligenz aus Cattell’s Faktorenmodell vergleichen kann. Die Architektur eines künstlichen Neuronalen Netzes lernt hierbei ohne menschliches Zutun anhand von Trainingsdaten, bestimmte Problemstellungen zu bewältigen. Auch hier ist jedoch erneut das Zusammenspiel von fluider und kristalliner Intelligenz hervorzuheben. Wie auch bei Cattell’s Faktorenmodell, bei dem die fluide Intelligenz durchaus als Grundlage zu der kristallinen Intelligenz verstanden werden kann, basiert der Erfolg des Lernprozesses eines künstlichen neuronalen Netzwerkes auf der darunterliegenden Hardware und Software-Architektur, die essentiell für die Lerngeschwindigkeit und den Lernerfolg sind.[13] Bestimmte maschinelle, medizinische Diagnosen sind prozentual bereits besser als menschliche Diagnosen.[14] Weitere Beispiele, wie KI den Menschen unterstützen kann, finden sich in der Studie „In-depth: Artificial Intelligence 2019“.[15] Andererseits muss man jedoch zugeben, dass sich künstliche neuronale Netze wie Black Boxes verhalten. Wir können nicht wirklich analysieren, warum die Maschine das Motiv erkannt hat.[16] Das erinnert an ein biologisches neuronales Netz wie das Gehirn eines Menschen. Wie dort die initialen Verschaltungen zustande kommen und das neuronale Netz zu einem Ergebnis führt, ist nur annähernd erklärt.
Auch können die Trainingsdaten für ein künstliches neuronales Netz nicht immer sicher vorurteilsfrei sein. So hat Amazon einen Auswahlalgorithmus bei Bewerbungen eingesetzt, der weibliche Bewerbungen eher aussortiert hat, weil er mit überwiegend männlichen Bewerbungsdaten trainiert wurde. Für den Algorithmus waren weibliche Bewerber minderwertiger.[17]
Fazit
Künstliche Intelligenz ist nicht neu und begegnet uns dauernd, oft unbemerkt, im Alltag. Wir erfahren dadurch viele bequeme Funktionen. Die neue Technik birgt jedoch auch Gefahren und es ergeben sich ethische und philosophische Fragen. Stephen Hawking war der Meinung, dass KI das Ende der Menschheit bedeutet.[18] Nils Broming zeichnet in seinem Buch Superintelligenz[19] mögliche Szenarien, wenn KI intelligenter als Menschen wird und sie ähnlich wie der Klimawandel heutzutage nicht mehr beherrschbar ist. Diese Bedenken werden ihren Fortschritt und zukünftige Alltäglichkeit aber nicht aufhalten können.
Fußnoten
[1] Vgl. Barthelmeß U., Furbach U.(2012): S.13
[2] Vgl. Maltby J., Day L., Macaskill A.: S.509f.
[3] Vgl. Maltby J., Day L., Macaskill A.: S.521f.
[4] Vgl. Maltby J., Day L., Macaskill A.: S.523
[5] Vgl. Buxmann P., Schmidt H.(Hrsg.): S.6f.
[6] Vgl. Fraunhofer Gesellschaft – Maschinelles Lernen: (Abruf 23.8.2019) S.8
[7] Vgl. Buxmann P., Schmidt H.(Hrsg.): S.8
[8] Vgl. Kreutzer R., Sirrenberg M.: S.4
[9] Vgl. Kreutzer R., Sirrenberg M.: S.8f.
[10] Vgl. Barthelmeß U., Furbach U.(2019): S.87f.
[11] Vgl. Kreutzer R., Sirrenberg M.: S.5, Ertel W.: S.291f.
[12] Vgl. Barthelmeß U., Furbach U.(2019): S.88f.
[13] Vgl. Barthelmeß U., Furbach U.(2019): S.22f.
[14] Vgl. Kreutzer R., Sirrenberg M.: S.187
[15] In-depth: Artificial Intelligence (Abruf 23.8.2019)
[16] Vgl. Buxmann P., Schmidt H.(Hrsg.): S.17
[17] Vgl. Heise Online – KI-Benachteiligungen (Abruf 23.8.2019)
[18] Vgl. Hawking S.: S.210f.
[19] Broming N.: Superintelligenz
Abbildungen
Titelbild: https://pixabay.com/de/illustrations/k%C3%BCnstliche-intelligenz-ai-roboter-2228610/
Literaturverzeichnis
Barthelmeß U., Furbach U.: IRobot – uMan, Springer-Verlag, Berlin Heidelberg, 2012.
Barthelmeß U., Furbach U.: Künstliche Intelligenz aus ungewohnten Perspektiven, Springer Fachmedien Wiesbaden GmbH, 2019.
Broming N.: Superintelligenz, Suhrkamp Verlag, 2014.
Buxmann P., Schmidt H.(Hrsg.): Künstliche Intelligenz, Springer-Verlag GmbH Deutschland, 2019.
Ertel W.: Grundkurs Künstliche Intelligenz, 4. Auflage, Springer Fachmedien Wiesbaden GmbH, 2016.
Hawking S.: Kurze Antworten auf grosse Fragen, Klett-Cotta Verlag, 16. Auflage, 2019.
Kreutzer R., Sirrenberg M.: Künstliche Intelligenz verstehen, Springer Fachmedien GmbH, Wiesbaden, 2019.
Maltby J., Day L., Macaskill A.: Differentielle Psychologie, Persönlichkeit und Intelligenz, 2. Auflage, Pearson Studium, 2011.
Walsh T.: 2062, riva Verlag, München, 2019.
Internetquellen
Fraunhofer Gesellschaft – Maschinelles Lernen, Abruf am 23.8.2019, verfügbar unter https://www.bigdata.fraunhofer.de/content/dam/bigdata/de/documents/Publikationen/Fraunhofer_Studie_ML_201809.pdf
In-depth: Artificial Intelligence 2019, Abruf am 23.8.2019, verfügbar unter https://de.statista.com/statistik/studie/id/50489/dokument/artificial-intelligence/
Heise Online – KI-Benachteiligungen, Abruf am 23.8.2019, verfügbar unter https://www.heise.de/newsticker/meldung/Amazon-KI-zur-Bewerbungspruefung-benachteiligte-Frauen-4189356.html