„Erpresserische“ KI
Der ORF berichtet: die Firma Anthropic hat festgestellt, dass die von ihr erzeugte KI „Claude“ User:innen erpressen würde. Wie das?
Naja: man hat „Claude“ mit fingierten E-Mails gefüttert, in denen von der Ablöse des Programms die Rede war – und von Infos, nach denen ein Verantwortlicher für die Ablöse eine außereheliche Beziehung habe.
Was tut KI?
Es zeigt sich: KI macht nix Neues; sie verknüpft nur bekannte Dinge, mit denen man sie gefüttert hat, freilich eventuell neu und ungewohnt. Das sieht dann nach „Intelligenz“ aus. (Das sieht auch bei Menschen intelligent aus, wenn sie bekannte Dinge ungewöhnlich kombinieren. Oder „verweht“; oder „chaotisch“.)
Wenn man ihr geradezu „die Rutsche legt“ zu einer Erpressung, dann findet sie das auch.
Wenn du deiner KI keine Moral, keinen Ehrenkodex einfütterst, wird sie auch keine Moral und keine Vorstellungen von Unehrenhaftigkeit entwickeln. „What goes in will come out“, as simple as that!
Wenn du deine KI mit Kapitalismus fütterst …
… wird sie auch entsprechend „kapitalistisch argumentieren“. Und so weiter.
Was lernen wir daraus?
Verlass dich nicht auf KI: sie reagiert so, wie sie ihre Entwickler programmiert gefüttert haben.
Schreibe einen Kommentar