Korrelation und Kausalität

Korrelation und Kausalität - spielt das für die KI noch eine Rolle?

11
.
Okt 2019
von
Michael Welsch
&

Korrelation und Kausalität sind beides Wörter, mit denen ein Zusammenhang ausgedrückt wird. Während das eine Wort aus der Statistik stammt, kommt das andere aus der Physik. Die Unterschiede beruhen auch auf diesen unterschiedlichen Grundlagen.

Die Korrelation bezieht sich auf eine Beziehung zwischen den Ausprägungen von zwei Beobachtungen in einer Reihe von Wiederholungen. Ändert sich die Beobachtung von A, so ändert sich tendenziell auch die Beobachtung von B. Der Korrelationskoeffizient ist eine Möglichkeit, eine solche Korrelation zu quantifizieren. Entscheidend ist jedoch die Tatsache, dass Wiederholungen beobachtet werden, denn ohne Wiederholungen kann keine Statistik erstellt werden. Man erkennt den Zusammenhang durch Wiederholungen und Variationen in diesen Wiederholungen.

Unter Kausalität versteht man eine kausale Beziehung, die unabhängig von der Form der Beobachtung von A und B und der Notwendigkeit von Wiederholungen zwischen A und B besteht. Wenn sich A ändert, ändert sich B oder umgekehrt. Typischerweise beschreibt eine Differentialgleichung die allgemeine Beziehung zwischen A und B, und die Randbedingungen beschreiben die konkreten Ausprägungen der Beobachtungen und die Wirkungsrichtung von A und B. Außerdem verlangt die Physik, dass die Beobachtungen nicht die Quelle der Modellierung sein dürfen, sondern aus einem unabhängigen Prinzip abgeleitet werden müssen. Häufig wird zwischen den Beobachtungen von A und B und den zugrunde liegenden internen Ereignissen oder Zuständen unterschieden. Beobachtungen und Modelle können verwendet werden, um auf innere Zustände zu schließen. Man muss aber immer sagen, was eine Randbedingung ist, die dem Status einer Stellgröße im Sinne einer Wirkungsursache gleichkommt. Wenn man den Zusammenhang eines solchen Parameters modelliert und das Ergebnis validiert, ist ein kausaler Zusammenhang einfach a-priori gegeben. Potenziell kausale Zusammenhänge entstehen immer dann, wenn ein Mensch ein technisches Gerät ausprobiert und dabei eine Beobachtung zu einem Parameter oder einer Randbedingung erhebt, diese kontrolliert verändern kann und in einen Zusammenhang mit weiteren Beobachtungen stellt. So wird gezielt eine direkte Ursache-Wirkungs-Beziehung konstruiert und der Zusammenhang systematisch von Umwelteinflüssen isoliert. Man erkennt den Zusammenhang durch systematische Vereinfachung und Isolierung von Einflüssen.

Selbst wenn im Hintergrund eine unbekannte dritte Einflussgröße wirkt und vollständig für die Ausprägungen von zwei Beobachtungen verantwortlich ist, kann die Ausprägung von A nicht unabhängig von B verändert werden, ohne dass diese Ausprägungen durch die dritte Einflussgröße möglich sein müssen. Es ist also nicht möglich zu unterscheiden, ob es einen dritten Einfluss gibt, wenn B perfekt aus A vorhergesagt werden kann.

Ich möchte Ihnen ein Beispiel geben. Nehmen wir eine sich öffnende und schließende Tür. Zum einen bestimmen wir den Öffnungswinkel mit einem Winkelmesser, zum anderen machen wir ein Foto von der Szene. Beides sind unabhängige Beobachtungen. Stellen Sie sich vor, Sie können den Winkel direkt ändern. Die Frage ist, wie sich dies auf das Bild auswirkt. Zu diesem Zweck modellieren wir die Beziehung zwischen Winkel und Bild, um das Bild anhand des Winkels vorherzusagen. Bei Beobachtungen gilt nun, zumindest in der klassischen Physik, dass Ereignisse nur beobachtet werden und Beobachtungen keine Parameter beeinflussen sollten, zumindest bei einem guten Versuchsaufbau. Nun zieht ein Mensch, der dritte Einfluss in unserem Beispiel, zu verschiedenen Tageszeiten an der Angelschnur und die Veränderung des Bildes hängt nicht nur von der Position der Tür, sondern auch vom Umgebungslicht ab. Das ändert nichts an der grundsätzlichen Beziehung zwischen dem Bild und dem Winkel. Wenn man diese beiden Merkmale mit geeigneten mathematischen Methoden aus dem Bild extrahiert, korreliert ein Merkmal mit dem Winkel und das andere Merkmal mit der Tageszeit, während Winkel und Tageszeit nicht korrelieren.

Das Vorhandensein zusätzlicher Merkmale würde bedeuten, dass die Ursache für die Schwankungen der Pixelwerte nicht vollständig durch Tageszeit und Winkel vorhergesagt werden kann. In diesem Fall liegt eine Informationslücke vor.

Dieser zusätzliche Freiheitsgrad des Bildes ist aus informationstheoretischer Sicht interessant und sorgt für unvorhersehbare Überraschungen. Aus verfahrenstechnischer Sicht bedeutet dies jedoch nichts anderes als einen unsicheren Prozess. Am besten wäre es natürlich, wenn sich das Bild, sofern es sich um ein Qualitätsmerkmal handelt, vollständig aus unabhängigen Informationsquellen vorhersagen ließe. Dann ist das Bild aus informationstheoretischer Sicht langweilig und der Prozess ist stabil. Jedes unerwünschte Merkmal lässt sich auf eine bestimmte Eigenschaft einer Beobachtung zurückführen, die im Idealfall ein beeinflussbarer Parameter ist. Zu der Frage, ob Korrelation und Kausalität für KI noch eine Rolle spielen, würde ich sagen, dass gerade die nicht korrelierenden und unbekannten Zusammenhänge für KI-Anwendungen von größtem Interesse sind. Diese können sowohl eine Quelle der Gefahr als auch zumindest immer eine Quelle neuer Erkenntnisse sein. Eine auf neuronalen Netzen basierende KI, die nur vorhersagt, was bereits bekannt ist, insbesondere wenn sie übermäßig viel Training benötigt, und das Unbekannte nicht als Unbekanntes einstuft, sondern einfach das nächstbeste Bekannte interpretiert, ist dazu nicht in der Lage. Das Prinzip der Korrelation und der Kausalität ist daher von besonderem Interesse, um das Prinzip der menschlichen Aufmerksamkeit, Neugierde und Wachsamkeit anzupassen. Eine KI muss ihre eigenen Grenzen des Erkennens erkennen und jederzeit Aussagen darüber liefern, eine "Ich weiß, dass ich nichts weiß"-Fähigkeit, aber gerne in quantisierter und nicht binärer Form

Diese Fähigkeit wird ein wesentliches Kriterium sein, um eine KI auditierbar zu machen. Die Überprüfbarkeit von Algorithmen wird voraussichtlich ab etwa 2025 das entscheidende Kriterium für den Einsatz solcher Algorithmen in der Automatisierung sein. Korrelation und Kausalität ist daher ein Top-Thema für KI.

Folgen Sie mir auf
Wir optimieren nicht nur die Produktionsprozesse, sondern auch unsere Website! Hierfür verwenden wir Tools wie Cookies für Analyse- und Marketingzwecke. Sie können Ihre Cookie-Einstellungen jederzeit ändern. Informationen und Einstellungen