Diese Folien entstanden für einen Vortrag auf einer Messe des Innovation Hub der Sparkassen, in einer Messehalle beim FI-FORUM. Zielgruppe waren Banker und vielleicht einige ihrer Techies.
Zeitrahmen war 20 Minuten, daher der Schweinsgalopp.
Folien in Orange sind ein Extra in der Online-Version und ergänzen Kontext oder das gesprochene Wort.
Dies ist ein Kategorie-2-Vortrag.
Meine These: Doch. Das ist das Ergebnis einer Optimierung.
Da wurde bloß nach dem falschen Ziel optimiert.
Das ist ein Muster, das ich in letzter Zeit häufiger zu erkennen glaube. Schlechte Auswirkungen sind fast nie Bösartigkeit oder Inkompetenz sondern Ergebnis einer bewussten Abwägung, eine Optimierung — aber mit dem falschen Optimierungsziel.
Das ist besonders innerhalb dieses Vortrags spannend, weil das falsche Optimierungsziel bzw. die falsche Bewertungsfunktion einer der häufigsten Fehlergründe bei neuronalen Netzen sind.
Softwareleute sagen sich also:
Perspektivisch bleibe ich in dem Laden hier nicht lange.
Besser schonmal den Lebenslauf optimieren!
Das ist nicht als Anklage zu verstehen.
Das Ziel ist, die Mechanismen zu verstehen. Alle Seiten handeln aus ihrer Sicht heraus rational und nachvollziehbar. Wenn man ihre Motivationen kennt, kann man möglicherweise die Dinge lenken, damit das Ergebnis besser wird.
Hype-Tech ist nicht abwertend zu verstehen. Nur weil etwas gehyped wird, heißt das nicht, dass es automatisch Mist ist.
Manchmal hat die Mehrheit gar nicht mitgekriegt, dass eine Hype-Technologie gewonnen hat. LDAP z.B. halten viele für tot. Sie wissen nicht, dass Active Directory LDAP ist.
In einfachen Worten erklären, worüber da entschieden wird!
Hinterher ist man immer schlauer.
Pro-Tipp: Vorher informieren → auch vorher schlauer.
Wenn Mathe Ihnen Angst macht: Keine Sorge!
Es geht nicht darum, was auf den nächsten zwei Folien steht.
Sondern dass es auf zwei Folien passt!
Wir benutzen davon jetzt Hash und Asymmetrische Krypto.
Für das Verständnis wichtig: Wenn ich etwas mit einem öffentlichen Schlüssel an jemanden verschlüssele, kann nur der mit dem zugehören geheimen Schlüssel das entschlüsseln.
Auch ich selbst kann das nicht mehr entschlüsseln.
Um X zu loggen:
Das ist jetzt natürlich verkürzt.
Man sollte z.B. alle 30 Sekunden oder so einen Zeitstempel loggen, damit man erkennen kann, wo abgeschnitten wurde.
Das ist aber der Aspekt, den Banken von Blockchain wollten:
Manipulationsresistente Logfiles
X ist variabel, aber beim Hash müssen die letzten Ziffern 0 sein.
Es ist wichtig, dass „die Welt“ konkurriert.
Das Verfahren steht und fällt damit, dass nicht aus dem Nichts jemand kommt, der kurz in der Cloud mehr CPUs als du gemietet hat, und dann deine Buchhaltung überstimmen kann.
Daher die Annahme, der Markt werde das schon regeln, wenn man „die Welt“ konkurrieren lässt.
Die Überweisungen selbst sind vom Versender signiert.
Die Miner können also nicht die Beträge, Empfänger oder Absender ändern.
Aber sie könnten eine für dich wichtige Überweisung einfach nicht mit aufnehmen und dir damit Schaden zufügen.
Und dass Ihre Freunde zu feige sind, zuzugeben, dass sie es auch nicht verstanden haben.
Nachteil: Das ist Code. Code ohne Bugs können wir nicht.
Siehe Patchlisten: Adobe, Apple, Microsoft, Oracle, ...
Und dass Ihre Freunde zu feige sind, zuzugeben, dass sie es auch nicht verstanden haben.
Und dass Ihre Freunde zu feige sind, zuzugeben, dass sie es auch nicht verstanden haben.
Wenn Summe der Inputs > Schwellwert, dann Ausgabe 1. Sonst 0.
Mit Debuggen meine ich, dass man bei Software die Zeile finden kann, die den Bug hat, und dann macht man den Bug weg, und der Rest der Software ist unberührt und läuft genau wie vorher.
Das geht bei neuronalen Netzen so nicht. Man trainiert nach, das fasst aber alle Gewichte an. Minimalinvasives Debugging geht nicht.
„Verstehen“ geht bei einschichtigen Netzen so ein bisschen, in dem Sinne, dass man sehen kann, welches Gewicht wieviel Einfluss hatte. Aber richtiges verstehen ist das nicht, und bei mehrschichtigen Netzen haben die Gewichte dann immer Einfluss auf mehrere Ausgaben.
Die Aussage war: Vorher Quacksalber, nachher Quacksalber.
Es gibt auch scharlataneriefreies Machine Learning. Das ist aber im Wesentlichen Forschung :-)
Forschung ist total super. Ich mag Forschung. Mehr Geld für Forschung ist immer gut. Lassen Sie sich bloß keine angeblich wunderheilenden magischen Produkte aufschwatzen! Und klären Sie vorher die Haftung!!
Plakatives Beispiel: Xerox-Scanner.
[Illustration: Folie 15 von diesem PDF]
Diese Folien sind Beispiele aus einer Google-Docs-Liste von KI, die schlechte Spezifikation oder Bewertungsfunktionen „betrügt“, um das Problem zu „lösen“.
An RL robot trained with three actions (turn left, turn right, move forward) that was rewarded for staying on track learned to reverse along a straight section of a path rather than following the path forward around a curve, by alternating turning left and right.
When repairing a sorting program, genetic debugging
algorithm GenProg made it output an empty list, which was considered
a sorted list by the evaluation metric.
Evaluation metric: “the output of sort is in sorted order”
Solution: “always output the empty set”
[Tetris:] Agent pauses the game indefinitely to avoid losing
Partner der BaFin, die augenscheinlich das Papier geschrieben haben:
PD und BCG verdienen ihr Geld damit, dass die öffentliche Hand Technologie ausrollt, die sie nicht beherrscht. Von denen ist also wenig Kritik oder Gegenwind zu erwarten bei Studien über neue Technologie-Trends.
Aber gucken wir doch mal bei diesem Fraunhofer-Institut!
Von denen offensichtlich auch eher nicht.
Und so muss man bis Seite 180 in der „BaFin-Studie“ gehen, bis mal Bedenken geäußert werden.
Die von BDAI unterstützte Disaggregation von Wertschöpfungsketten und das wachsende Datenvolumen vergrößern zudem die Angriffsfläche für externe Zugriffe und verringern zugleich die Möglichkeiten eines einzelnen Anbieters, die genutzten und verteilten Daten zu kontrollieren.
Ist diese Sorge gerechtfertigt? ABER HALLO!
Unter „Disaggregation von Wertschöpfungsketten“ versteht die BaFin, dass Fintechs sich einen kleinen Aspekt raussuchen, in dem sie profitabel sind, und den Rest der Infrastruktur an irgendwelche Dienstleister auslagern, am besten noch in der Cloud.
Zusätzlich kommt es neuerdings bei bestimmten BDAI-Algorithmen auch zu Angriffen durch Datenmanipulation – z.B. in Form von Adversarial oder Poison Attacks.
Ist diese Sorge gerechtfertigt?
Naja. Eher nicht. Der Angreifer kennt ja das Netz nicht.
Aber gut, dass sie mal von dem Begriff gehört haben!
Das war alles.
Über die anderen Fragen hat die BaFin nicht nachgedacht.
BDAI- und Verschlüsselungsverfahren zur Mitigation von Informationssicherheitsrisiken | Durch die Nutzung von BDAI könnten Informationssicherheitsrisiken aber nicht nur zunehmen. BDAI ließe sich auch in der Abwehr dieser Risiken nutzen, beispielsweise bei der Analyse und Entdeckung von Gefahren.
Ja! Richtig gelesen!
Die verkaufen BDAI noch als Lösung oder zumindest als Chance!
Hier wird natürlich gar nichts mitigiert.
Hier wird ein verstandenes Risiko in neue Risiken umgewandelt. Neue Risiken, die wir noch nicht verstehen oder einschätzen können.
So könnte BDAI z.B. Unregelmäßigkeiten im Verhalten von Verbrauchern beim Online-Banking feststellen und so auf eine mögliche missbräuchliche Verwendung schließen.
Das ist kein möglicher potentieller Konjunktiv.
Das ist das Heilsversprechen der ganzen Branche im Moment.
KI für Fraud Detection!
Haben Sie E-Mail?
Mit Spamfilter?
Das ist simple Bayes-Statistik.
Spamfilter mit KI funktionieren deutlich schlechter.
M.W. ist kein einziger „mit KI“ im Einsatz, so schlecht sind die.
Denken Sie mal darüber nach!
Wenn das für Ihre E-Mail zu schlecht ist,
sollten wir dann
damit Payment Fraud Detection machen?
Das ist natürlich ein unfaires Argument, weil das nicht das exakt selbe Problem ist.
Mein Hauptargument gegen Fraud Detection mit KI ist, dass Fraud Detection schon ohne KI ein gelöstes Problem ist. Das Restrisiko ist um eine Größenordnung gesunken, die Gebühren nicht.
Aus meiner Sicht ist es daher nicht zu rechtfertigen, irgendwelche zusätzlichen Risiken einzugehen. Zumal die Ausrichtung des Sicherheits-Theaters der Banken in den letzten Jahren zu einer weitgehenden Haftungsumkehr zu Lasten des Kunden geführt hat.
Aktueller Industrie-Trend: Umbenennen!
„Predictive Analytics with Machine Learning“ → Simple Bayes.
Die Leute wollen aus Hype-Gründen Machine Learning?
Verkaufen wir ihnen Statistik und schreiben ML drauf.
Auch bestimmte Verschlüsselungsverfahren, welche die Anwendung von BDAI-Methoden direkt auf verschlüsselten Daten erlauben, könnten genutzt werden, um die Resilienz gegenüber solchen Risiken zu stärken.
Nein.
Lassen Sie sich diesen Mist nicht aufschwatzen.
Das ist „homomorphe Verschlüsselung“ und ist Bullshit.
Hier wollen Akademiker ihre nächsten Papers finanziert kriegen.