Gefährlich oder ungefährlich? Die Grenzen der Kriminalprognose.

Kriminalprognosen stehen im Zentrum besonders folgenreicher Entscheidungen im Straf- und Maßnahmenvollzug. Sie beeinflussen, ob und wann Menschen ihre Freiheit wiedererlangen, ob sie in Sicherungsverwahrung verbleiben oder unter Auflagen entlassen werden.

Im Interview beleuchtet Dr. Martin Brandenstein, promovierter Jurist und diplomierter Psychologe mit langjähriger Erfahrung in der Prognosepraxis, die Möglichkeiten und Grenzen kriminalprognostischer Instrumente, die Rolle ethischer Überlegungen und den Umgang mit Unsicherheiten in der Begutachtung. Seine differenzierten Ausführungen bieten einen tiefen Einblick in die fachlichen, methodischen und ethischen Herausforderungen dieses sensiblen Arbeitsfeldes.

Dr. Brandenstein, wie beurteilen Sie den aktuellen Stand der wissenschaftlichen Validität kriminalprognostischer Instrumente im deutschsprachigen Raum, insbesondere im Hinblick auf ihre Anwendung im Maßregelvollzug und der Sicherungsverwahrung?

Die Frage nach der wissenschaftlichen Validität kriminalprognostischer Instrumente verstehe ich in erster Linie als Frage danach, inwieweit die aus der Anwendung kriminalprognostischer Instrumente gewonnenen Daten und Schlussfolgerungen argumentativ belastbar sind. Unter methodischen Gesichtspunkten lässt die Aussagekraft kriminalprognostischer Instrumente nicht nur im deutschsprachigen Raum nach dem aktuellen Stand zu wünschen übrig.

Es lassen sich nach wie vor keine auch nur annähernd zwingenden Schlüsse aus den Daten sog. „aktuarischer“ kriminalprognostischer Instrumente ziehen. Aktuarische Instrumente sind statistisch entwickelte Kataloge von Kriterien, die für den jeweiligen Fall bepunktet werden können und als Ergebnis ein Maß für die Rückfallwahrscheinlichkeit angeben. Noch immer fehlt es an systematischen prospektiven Studien, die nicht lediglich ex post, also retrospektiv, die Übereinstimmung von Ergebnissen der Kriminalprognose mit tatsächlich eingetretenen Ereignissen korrelieren.

Dies vorausgeschickt ist allerdings vielerlei zu bedenken. Denn die insoweit unzulängliche argumentative Belastbarkeit von Daten aus kriminalprognostischen Instrumenten ist in mehrfacher Hinsicht schlichtweg der Natur und den Zwängen des Untersuchungsgegenstands und des Prognosevorgangs geschuldet.

Zunächst werden ganz regelmäßig nur als ungefährlich eingestufte Straftäter (bedingt) in Freiheit gelangen und dadurch einschlägigen Studien zugänglich gemacht. Es kann also lediglich ein Vergleich zwischen den mit Hilfe der kriminalprognostischen Instrumente ermittelten correct negatives – also den zutreffend als ungefährlich bestimmten Straftäter – einerseits und den false negatives – also den unzutreffend als ungefährlich bestimmten Straftäter – andererseits gezogen werden. Demgegenüber erhalten jene Straftäter, die für gefährlich gehalten und deswegen weiterhin im Vollzug behalten werden, keine Chance, ihre Ungefährlichkeit in Freiheit unter Beweis zu stellen und damit ihre Zuordnung zu den „Gefährlichen“ zu widerlegen. So bleibt im Dunkeln, wie viele false positives – also fälschlich als gefährlich bestimmte Straftäter – auf wie viele correct positives – also zutreffend als gefährlich bestimmte Straftäter – fallen.

Die Tatsache, dass lediglich die als ungefährlich eingeschätzten und sodann in die Freiheit entlassenen Straftäter einer Überprüfung der Richtigkeit des Prognoseergebnisses zugänglich sind, erschweren entscheidend eine am Maßstab der wissenschaftlichen Validität orientierte Entwicklung kriminalprognostischer Instrumente. Zu bedenken ist auch, dass es kaum je eine Testphase wird geben können, in der allein, sozusagen „blind“ den Ergebnissen kriminalprognostischer Instrumente gefolgt wird, nur um deren Gültigkeit für den Ernstfall auf die Probe zu stellen. Es wird aus guten Gründen regelmäßig dem „klinischen“ und selbst dem „intuitiven“ Eindruck – neben den Ergebnissen der kriminalprognostischen Instrumente – ein regelmäßig nur schwer bestimmbares, aber erhebliches Gewicht bei der endgültigen Prognosestellung zukommen. So viel Vertrauenskredit, um auch nur testweise kriminalprognostischen Instrumenten das entscheidende Sagen zu überlassen, wird man ihnen kaum je gewähren (können).

In den Handbüchern zu den Instrumenten lässt sich eine entsprechend auferlegte Zurückhaltung bei der beanspruchten Aussagekraft durchaus (weitestgehend) entnehmen. Konkret lässt sich dies bereits ersehen aus den recht grobschnittigen Risikokategorien und „Cut-off-Werten“, denen in den Instrumenten wie dem HCR-20, SVR-20, PCL-R, VRAG, LSI-R etc. die jeweils ermittelten Rohpunktwerte zuzuordnen sind. Regelmäßig wird in den Handbüchern darauf hingewiesen, dass die Funktion der Instrumente kaum mehr als über den Anspruch hinausgeht, keine wesentlichen Bezugspunkte der Kriminalprognose „vergessen“ zu lassen; eine genaue Einzelfallprüfung wird auch bei deren Inanspruchnahme nie verzichtbar sein. Damit wird ein Licht auf die spezifische qualitative – versus quantitative – Natur des Vorgehens und des Ziels der kriminalprognostischen Begutachtung geworfen. Der akademische Maßstab der Validität suggeriert irreführend, dass sich kriminalprognostische Instrumente unter exakten, naturwissenschaftlich messbaren Bedingungen einsetzen und bewerten lassen und sich mittels ihrer entsprechend naturwissenschaftlich exakt interpretierbare Ergebnisse erzeugen lassen. Ein solcher Erwartungshorizont an kriminalprognostische Instrumente verkennt die speziellen Anforderungen an Gegenstand und Verfahren der Kriminalprognose.

Nicht nur hat man es mit quantitativ schwer fassbaren Persönlichkeitsmerkmalen und ihren vielen Wechselbeziehungen z.B. mit biografischen Daten zu tun. Insbesondere hat man es bei der Kriminalprognose bereits in formaler Hinsicht mit nach Art, Breite, Intensität etc. noch nicht feststehenden Faktoren zu tun, die erst in der näheren oder ferneren Zukunft eine Rolle spielen (können). Die Vielzahl interdependenter Wechselbeziehungen unterschiedlichen Gewichts entziehen sich einem linearen Prüfungsschema. Zudem lässt die Vielzahl an in Vergangenheit, Gegenwart und Zukunft gleichzeitig zu berücksichtigenden Faktoren den Einfluss eines normativen Elements bei der Kriminalprognose unumgänglich werden. So wie ein Gericht sich aus der Würdigung eines Sachverhalts nicht ein Wissen, sondern „lediglich“ eine Überzeugung[1] zu bilden vermag, so auch die Sachverständigenperson in Bezug auf die Kriminalprognose.

Insoweit sind kriminalprognostische Instrumente nach dem Maßstab der wissenschaftlichen Validität allenfalls eingeschränkt empirischen Untersuchungen zugänglich.

Nur weil Kriminalprognosen schwierig zu erstellen sind, nimmt deren Erforderlichkeit nicht ab. Man wird sich immer zumindest darum bemühen müssen, vertretbare Ergebnisse so eng wie möglich einzukreisen. Das heißt auch, dass man für alle Anhaltspunkte dankbar sein muss, während gleichzeitig stets die Grenzen der Aussagekraft aller kriminalprognostischen Instrumente kritisch zu würdigen ist.

Mit Blick auf die Anwendung kriminalprognostischer Instrumente im Maßregelvollzug ist zu beachten, dass hier insgesamt häufiger klinische Auffälligkeiten gegenüber allgemein-kriminologischen Merkmalen in den Vordergrund treten, bei denen verstärkt je spezifische, individuelle Besonderheiten zu beachten sind. Insoweit wird hier kriminalprognostischen Instrumenten regelmäßig eine geringere Bedeutung zukommen.

Mit dem Verbleib in der Sicherungsverwahrung wiederum ist meist eine längere Haftdauer verbunden. Prognosen können am zuverlässigsten über Daten, die sich aus der Vergangenheit beziehen, getroffen werden. Dies ergibt sich unter anderem daraus, dass es bei vergangenem Geschehen – anders als bei jenem in der Zukunft – keinen Zweifel darüber gibt, dass dieses tatsächlich eingetreten ist; hier gibt es keinen Raum für Spekulation. Überhaupt gibt das Vergangene nicht nur Anlass, sondern auch die einzig verlässlichen materiellen Anknüpfungspunkte dafür, was sich in der Folge entwickeln könnte; das ist kein Spezifikum für Kriminalprognosen, sondern bezieht sich auf alle Prognosen, wie etwa auch auf Wetterprognosen: Das Vergangene ist letztlich der einzige Anknüpfungspunkt, an den gemutmaßte Entwicklungen in der Zukunft geknüpft werden können.

Dass daher auch für die Validität von kriminalprognostischen Instrumenten jenen Daten, die sich auf die Vergangenheit eines Probanden beziehen, das größte Gewicht beizumessen ist, lässt sich besonders anschaulich am HCR-20 ersehen, nach welchem der Vergangenheit (Historical data) 50%, demgegenüber der Gegenwart (Clinical data) nur 25 % und auch der Zukunft (Risk variables) nur 25 % Gewicht beizumessen ist. Je weiter sich ein Proband von jenen Daten entfernt, die sich auf seine Vergangenheit vor seinem Haftantritt beziehen lassen, desto unzuverlässiger wird auch die Aussagekraft der sich auf seine Vergangenheit beziehenden Daten. Mit größerer Dauer in Unfreiheit vergrößert sich damit auch der Spielraum für Entwicklungen, die ein Proband im Laufe seiner Haftzeit an den Tag zu legen vermag.

So wird man mit Bezug zu Maßregelvollzug und Sicherungsverwahrung sagen müssen, dass die Nützlichkeit kriminalprognostischer Instrumente in diesen Kontexten mit zunehmender Dauer immer deutlicher abnimmt und vermehrt durch eine qualitative, klinisch-kriminologische Einschätzung der Sachverständigenperson begleitet bzw. ersetzt werden müssen.

Inwieweit lassen sich Rückfallprognosen für Personen mit schwerwiegenden psychischen Störungen verlässlich erstellen – und wo liegen die Grenzen der Vorhersagbarkeit?

Hier gibt es keine Antwort, die allen schwerwiegenden psychischen Störungen gleichermaßen gerecht wird, denn dazu sind diese zu verschiedenartig in Ursprung und Symptomatik, auch unterschiedlich tief verwurzelt und entsprechend unterschiedlich behandelbar.

Handelt es sich gar um primär medizinisch zu behandelnde Störungsbilder habe ich als Psychologe vermehrt Acht darauf zu geben, mir keine Kompetenz anzumaßen, die mir gegenüber medizinisch ausgebildeten Psychiatern fehlt. Soweit sich die Frage allgemein auf die Grenzen der Vorhersagbarkeit von Kriminalprognosen bezieht, lässt sich nicht nur mit Bezug zu Personen mit schwerwiegenden psychischen Störungen sagen, dass man sich grundsätzlich in Demut üben sollte. Es gibt einfach zu viele Unwägbarkeiten und Ungewissheiten, die im Leben eines jeden Menschen eine Rolle spielen, sodass es für eine Sachverständigenperson verfehlt wäre zu meinen, es stehe ihr zu, als Mensch über andere Menschen eine allumfassende Deutungshoheit über deren weitere Entwicklung zu haben.

Im Gegenteil. Je nachdem, ob jemand unmittelbar nach seiner Haftentlassung den alten Kumpel trifft, mit dem er seine letzte Straftat geplant hatte oder ob er stattdessen die Frau seines Lebens trifft, die ihm Zuwendung, Orientierung und soziale Kontrolle zu bieten vermag, können Lebenswege frühzeitig denkbar unterschiedliche Richtungen bei gleicher Prognosebasis nehmen.

Die Leistung von Prognosen kann allenfalls, aber auch immerhin, darin bestehen, hinsichtlich möglichst berechenbarer Faktoren – etwa persönlichkeitsspezifische Änderungen infolge therapeutischer Einwirkung; Entwicklungen, welche die Wohnung, Arbeit, Schulden etc. betreffen – so eng wie möglich einen Rahmen abzustecken, innerhalb dessen sich kriminalprognostisch günstige oder ungünstige Szenarien als wahrscheinlich darstellen.

Da ein menschliches Leben sich nicht wie ein „Malen nach Zahlen“ gestaltet und gerade die entsprechenden Freiheitsgrade an Spontaneität und Flexibilität dem menschlichen Leben sogar einen subjektiv intrinsischen Wert verleihen, wird man sagen müssen, dass ein „falsches“ Gutachten – also eines, dessen Prognose sich als falsch herausgestellt hat – kein „schlechtes“ Gutachten sein muss, jedenfalls dann nicht, wenn dieses falsche Gutachten nach allen Regeln der zum Zeitpunkt der Begutachtung geltenden bzw. anerkannten Prognosestandards angefertigt wurde.

Es ist allerdings auch klarstellend darauf hinzuweisen, dass man in den allermeisten Fällen als Ergebnis einer kriminalprognostischen Begutachtung ohnehin nicht in Schwarz-Weiß-Manier lediglich „gefährlich“ oder „ungefährlich“ angibt. Im Falle der Befürwortung einer Entlassung wird von Auftraggebern, meist von Gerichten, schließlich auch erwartet, dass man Angaben zu Weisungen und Auflagen macht, mit denen erst eine Entlassung unter Berücksichtigung der berechtigten Sicherheitsinteressen der Allgemeinheit verantwortet werden kann. Kommt man umgekehrt zum Schluss, dass jemand sich als zu gefährlich für eine vorzeitige Entlassung präsentiert, wird man als Gutachter wiederum anzugeben haben, woran es noch für eine günstige Prognose fehlt; gegebenenfalls hat man auch auf Art und Frequenz von Vollzugslockerungen einzugehen.

Durch die Möglichkeit differenzierender Angaben zu den Bedingungen verschiedener Prognoseszenarios lassen sich mithin auch entsprechende Unsicherheitsgrade auffangen bzw. entschärfen.

Welche Rolle spielt das Zusammenspiel von klinischer und aktuarischer Prognose in Ihrer Arbeit, und wie bewerten Sie die zunehmende Bedeutung strukturierter professioneller Einschätzungen wie HCR-20 oder PCL-R?

Meines Erachtens kann klinischen und aktuarischen Instrumente allenfalls unterstützende, nie entscheidende Bedeutung zukommen. Die individualisierende, qualitative, sog. idiographische Betrachtungsweise sollte weit überwiegend im Vordergrund stehen gegenüber dem, was sich mittels vermeintlich standardisierter Instrumente – in sog. nomothetischer – Weise in quantitativ erfassbaren Daten ermitteln und zu Schlussfolgerungen kommen lässt.

Die für mich untergeordnete Rolle quantitativer Instrumente hat mehrere Gründe, von denen ich im vorliegenden Rahmen nur wenige kurz ansprechen kann. Ich möchte vorausschicken, dass ich hiermit lediglich meine eigene Position vertrete, ich also nicht den Anspruch erhebe, den allgemeinen wissenschaftlichen Konsens oder auch nur einen allgemein geteilten Konsens in der Prognosepraxis wiederzugeben.

Aktuarische Instrumente suggerieren fälschlicherweise naturwissenschaftliche Genauigkeit. Diese Prognoseinstrumente, also insbesondere Listen mit Kriterien, die sich je nach Ausprägungsstärke bepunkten lassen und mittels derer ein Summenwert ermittelt wird, lassen es so erscheinen, es könne standardisiert und insoweit auch mit naturwissenschaftlicher Exaktheit eine prognoserelevante Aussage getroffen werden.

So begrüßenswert das Ansinnen ist, das Prognoseverfahren zu standardisieren und objektivieren, so sehr fällt in vielerlei Hinsicht die Realität gegenüber dem Anspruch zurück. Denn zunächst lassen die Kriterien bei der Bepunktung – trotz der jeweils spezifisch anleitenden Handbücher – so viel Wertungsspielraum zu, dass man zugespitzt sagen könnte, dass am Ende die Punktzahl nicht nur die Persönlichkeit des Probanden abbildet, sondern im nicht zu vernachlässigenden Maß auch jene des Instrumentenanwenders.

Dieser Wertungsspielraum steht in einem bemerkenswerten Kontrast zum Anspruch der (angeblichen) Exaktheit und Unbestechlichkeit, die diese Instrumente suggerieren.

Das Zustandekommen der Bepunktungen ist alles andere als zwingend vorhersagbar. Die Aussagen wiederum, die sich aus den Punktwerten ergeben, bewegen sich ihrerseits in einem erstaunlich weiten Graubereich von so dürftiger Verbindlichkeit, dass man auf sie ohnehin von vornherein nicht auch nur annähernd eine Kriminalprognose stützen kann.

Und doch werden diese Instrumente so eingesetzt und die mittels derselben ermittelten Ergebnisse so verkauft, als könnten die Instrumente dem Anwender geradezu die gesamte Argumentationsarbeit abnehmen, nach dem Motto: „Zahlen lügen nicht“.

Dass bei ein und demselben Fall die Zahlen in ihrer Eigenschaft als „Messwerte“ der Gefährlichkeit bei diesen Instrumenten erheblich schwanken können, tritt demgegenüber in den Hintergrund. Solange diese Zahlen von den Auftraggebern nicht allzu sehr hinterfragt werden, scheinen viele Gutachter dankbar dafür zu sein, etwas angeblich „Objektives“ vorzeigen und damit Argumentations- und Verantwortungslast abgeben zu können.

Dies führt unmittelbar zum nächsten Problempunkt, der diesen Instrumenten anhaftet: Ich möchte nicht meinen Prognosekollegen gesamthaft zu nahetreten, aber unter ihnen wird kaum jemand bestreiten können, dass der bereits angesprochene Bewertungsspielraum sich leicht in der Weise ausfüllen lässt, dass am Ende die Punktzahl genau das widerspiegelt, was zur beabsichtigten Argumentationslinie passt. Man kann sich dann auf das „objektiv ermittelte Ergebnis“ berufen, wenn man einen wegen Mordes Verurteilten für gefährlich halten „will“ und dazu „nur“ den Cut-Off-Wert erreichen muss – besser noch, für die Optik: man lässt den Probanden nicht nur knapp den Cut-Off-Wert erreichen, sondern packt noch 2 Punkte „Verhandlungsmasse“ oben drauf – um mit dreistem Selbstbewusstsein aufzutreten: „Seht her, ich bin mit meiner Wertung nicht allein: Dieses Instrument stimmt mir zu.“

Man bewegt sich grundsätzlich gefährlich nahe an zirkulären Argumentationsformen, da man verführt ist, die Gefährlichkeit einer Person mit ihrer Psychopathologie zu begründen, welche man man ihrerseits aus der in der Straftat zum Ausdruck gebrachten Gefährlichkeit ableitet.

Ich bin grundsätzlich für jedwede Daten- und Informationsquelle in einem konkreten Fall dankbar. Deswegen würde ich auch kaum je darauf verzichten, in einschlägigen Fällen den HCR-20 oder den PCL-R zu verwenden. Aber man muss sich selbst gegenüber genügend ehrlich sein, um bei der Anwendung dieser Instrumente sich nicht von seinem eigenen Wunschdenken korrumpieren zu lassen. Denn man will doch zusätzliche, vom bisherigen Eindruck unabhängige Daten in Erfahrung bringen, nicht hingegen solche, die lediglich von vornherein den bisherigen Eindruck zu bestätigen vermögen und damit die Informationsbasis gar nicht vergrößern. Man muss also auch aufpassen, keinem Confirmation Bias zu unterliegen.

Lässt man Extremfälle außer Betracht – übrigens, mit Verlaub: Haben Sie den PCL-R schon einmal probeweise auf den aktuellen Präsidenten der Vereinigten Staaten angewandt? – wird man sich im Meer der Grautöne schwertun, aus den Instrumenten zufriedenstellend verbindliche Aussagen zu gewinnen.

So verbindlich und entlang quantifizierbarer Grenzen lassen sich sozialwissenschaftliche Sachverhalte, die ein Mensch in all seiner Komplexität mitbringt, nun mal nicht „zurechtschnitzen“ oder „messen“.

Es mag nicht dem gegenwärtigen Zeitgeist entsprechen, einer differenzierenden und nuancierenden Betrachtungsweise das Wort zu reden; „Wahrheit“ und „Fakten“ scheinen heute nur in vermeintlich „eindeutigen“ Schlussfolgerungen wie „gut“ oder „böse“ gesehen bzw. akzeptiert zu werden. Dem ist allerdings klarstellend entgegenzuhalten, dass die Zuordnung von Zahlen zum komplexen Bedingungsgefüge einer Persönlichkeit deren Ambivalenzen, Widersprüche und Grautöne eher verkleidet als prognoserelevant aufdeckt.

Ich bin also insgesamt eher skeptisch, was den Wert von aktuarischen Instrumenten anbelangt. Klinische sind gegenüber aktuarischen Instrumenten besser standardisiert, denn sie lassen sich leichter und zielführender nach wissenschaftlichen Kriterien entwickeln. Daraus ergibt sich auch, dass sie weniger wertungsabhängig im Gebrauch sind als aktuarische Prognoseinstrumente, auch was die Validität der mittels der klinischen Instrumente zu treffenden Aussagen anbelangt. Dennoch gilt auch bei den klinischen Instrumenten – wie z.B. dem FPI-R (Freiburger Persönlichkeitsinventar – Revidierte Fassung) –, dass sie von Fall zu Fall unterschiedlich nützlich sein können. Dies kann bei klinischen Instrumenten jedoch immerhin genauer als bei den Prognoseverfahren über die Ausprägung einzelner Kriterien erkannt, gekennzeichnet und interpretiert werden (z.B. indem Ausprägungen auf dem Kriterium „Offenheit“ oder „Impression-Management“ für oder gegen eine sozial erwünschte Selbstdarstellung sprechen).

Wie gehen Sie mit ethischen Dilemmata um, die sich aus der Prognosepraxis ergeben – insbesondere im Spannungsfeld zwischen Sicherheitsinteressen der Allgemeinheit und Freiheitsrechten des Betroffenen?

Es gibt viele unterschiedliche ethische Dilemmata – Vertraulichkeit vs. Distanz zum Probanden; umfassende Persönlichkeitsausforschung bei gleichzeitigem Schutz der Menschenwürde; auf verbotene Methoden verzichten, aber doch undurchschaubare Methoden einsetzen; (zeit-)ökonomisch arbeiten, aber dennoch sorgfältig –, die ihre je spezifischen Anforderungen mit sich bringen und entsprechende „Lösungen“ erfordern.

Speziell zum angesprochenen Spannungsfeld ist zu sagen, dass als Basisrate eine gewisse „Gravitation“ hin zur Neigung bestehen wird, „im Zweifel“ einen schweren Straftäter für gefährlich zu halten. Man möchte als Sachverständigenperson schließlich ruhig schlafen, keine Schlagzeile über sich lesen, wonach „dieser“ Gutachter die Schuld dafür trägt, dass ein Mord von einem fälschlich als ungefährlich eingeschätzten Straftäter begangen wurde etc.

Tatsächlich gehen die Schätzungen, wie stark entsprechende Befürchtungen Kriminalprognosen beeinflussen, sehr weit auseinander, aber sie fallen – wenig überraschend – stets deutlich zu Ungunsten der ungefährlichen Probanden aus. Denn „praktischerweise“ können Gutachter, die einen Probanden für gefährlich halten, nicht widerlegt werden, da jene Probanden aufgrund der ihnen attestierten Gefährlichkeit natürlich weiterhin in Haft verbleiben und aus dieser heraus kaum – allenfalls innerhalb der Haft – ihre Ungefährlichkeit unter Beweis stellen können.

Nur die „false negatives“, also die fälschlich als ungefährlich eingeschätzten Straftäter, nicht die „false positives“ können den Gutachtern in diesem Sinne „zum Verhängnis“ werden.

Wie in der Frage bereits anklingt, sollten nicht nur die Interessen der Allgemeinheit, sondern auch jene des Betroffenen bei der Begutachtung stark präsent sein. Denn ein Gutachten, wonach ein Proband noch gefährlich ist, trägt dazu bei, dass dieser womöglich zu Unrecht auf Jahre unwiederbringliche Lebenszeit Tag für Tag, Nacht für Nacht im Gefängnis verbringt.

Um diesen Befürchtungen so weit wie möglich den Wind aus den Segeln zu nehmen und sich als Sachverständigenperson so weit wie möglich Druck zu nehmen, ist es meines Erachtens wichtig, vor allem zwei Aspekte im Auge zu behalten:

Zum einen lege ich besonders viel Wert auf eine genaue Dokumentation sowohl des Explorations- wie auch des Wertungsprozesses. Indem ich so genau wie möglich dokumentiere, auf welche Weise ich zu welchen Daten gekommen bin und mit welcher Wertungsrichtung und mit welchem Gewicht ich diese in die Gesamteinschätzung einfließen lasse, nehme ich Angriffsfläche. Denn der Auftraggeber wird denkbar eng beim Begutachtungsprozess an die Hand genommen, sodass ihm der Spielraum fehlt, um behaupten zu können, ich hätte irreführende, zu wenig konkrete oder ambivalent deutbare Ausführungen geliefert, die zu falschen Schlussfolgerungen geführt hätten. Je genauer ich mein Prognosevorgehen und das Prognoseergebnis selbst dokumentiere, desto eher kann ich auch ein Ergebnis vertreten, das sich weniger an der öffentlichen Meinung als an dem orientiert, was an Aufforderungscharakter vom materiellen psychologischen Gehalt des jeweils vorliegenden Falls ausgeht.

Zum anderen ist es ja, wie bereits erwähnt, in den seltensten Fällen so, dass das Ergebnis lediglich einem Daumen nach oben oder nach unten entspricht bzw. entsprechend der juristisch gepflegten „Notation“: gefährlich (–) oder gefährlich (+). Vielmehr werden nach beiden Richtungen die Ergebnisse abgefedert z.B. durch Einschätzungen und Empfehlungen zu Lockerungen in der Haft oder – bei vorzeitiger Haftentlassung – z.B. durch Angaben zu Weisungen, die jemand im Falle einer vorzeitigen Entlassung einzuhalten hat.

Es sollte klargestellt werden, dass die letzte Verantwortung natürlich stets beim Auftraggeber bleibt, in Deutschland regelmäßig bei der Strafvollstreckungskammer, wo die Sachverständigenperson als „Gehilfe des Gerichts“ tätig wird. Ohne Kompetenzanmaßungen in beide Richtungen geht es aber nunmal nicht: Die forensisch-psychologische Sachverständigenperson muss sich anmaßen zu wissen, welche psychologischen Ausführungen für den Auftraggeber aus dem strafvollzugsrechtlichen Bereich relevant sind, obwohl sie (in der Regel) nicht juristisch geschult ist; der Auftraggeber aus dem strafvollzugsrechtlichen Bereich wiederum muss sich anmaßen zu wissen, welch strafvollzugsrechtliche Bedeutung die psychologischen Ausführungen aufweisen, obwohl er (in der Regel) nicht psychologisch geschult ist. Beide Seiten müssen also von vornherein bereit sein, das ihnen Mögliche und Notwendige zu tun, um diese Friktion zu „kitten“ und sich gegenseitig entgegenzukommen. Daher muss ich als Sachverständigenperson ungeachtet der letzten Verantwortung des Gerichts meinem Auftrag dadurch gerecht werden, dass ich alles dafür tue, damit meine Ausführungen auch für psychologische Laien so verständlich und aussagekräftig wie möglich sind. Was in meinem Fall in diesem Zusammenhang nicht schaden dürfte, ist, dass ich sowohl diplomierter Psychologe als auch promovierter Jurist bin und damit die juristische Lesart eines psychologischen Gutachtens gut antizipieren kann.

Freilich bleibt ein Berufsrisiko, das einen nicht davor bewahrt, sich auch mal mit schweren Folgen eines falschen Gutachtenergebnisses konfrontieren zu müssen. Bisher hatte ich Glück, dass mir das nicht passiert ist. Aber wenn es passieren sollte, hoffe ich, mir entscheidend vor Augen halten zu können, dass ich alles nach bestem Wissen und Gewissen getan habe und auch für mich gilt: dass ein „falsches“ Gutachten kein schlechtes Gutachten sein muss.

Wie steht es um die Qualität und Konsistenz forensisch-psychiatrischer Gutachten, die maßgeblich für Entscheidungen über Entlassung, Verlegung oder weitere Verwahrung sind?

Die einheitliche, vor allem die einheitlich hohe Qualität forensisch-psychiatrischer Gutachten lässt insgesamt noch zu wünschen übrig, was auch für jene Gutachten gilt, die maßgeblich für Entscheidungen über Entlassung, Verlegung oder weitere Verwahrung sind.

Man wird indes zugestehen müssen, dass die Anforderungen, die an Gutachter im Rahmen der Prognose gestellt werden, von Fall zu Fall sehr unterschiedlich sind. Dies betrifft nicht nur die jeweils strafvollstreckungsrechtlich relevante Fragestellung – Entlassung, Verlegung oder weitere Verwahrung etc. –, sondern insbesondere die deliktsspezifischen, altersmäßigen, biografischen und persönlichkeitsspezifischen Unterschiede, damit einhergehend auch all jene Unterschiede, die im sozialen Empfangsraum im weitesten Sinne bestehen, etwa hinsichtlich Beruf, Wohnung, Schulden, nicht zuletzt auch Familie, Freunde, Partnerschaft, Kinder.

Es liegt also in der Natur der Sache, dass es mit Herausforderungen verbunden ist, all den unterschiedlichen Anforderungen, die an die Kriminalprognose gestellt werden können, etwa über Zusatz- oder Weiterbildungen zu einer einheitlich höheren Qualität zu verhelfen.

Jede Sachverständigenperson wird sich einstweilen insbesondere dadurch auszuzeichnen versuchen müssen, dass sie Gesichtspunkte im Auge behält, die unabhängig von den spezifischen Anforderungen des jeweils vorliegenden Falles zu beachten sind: Von großer Bedeutung sind vor allem Objektivität und Unbestechlichkeit. Letztere kann durch die „Hausgutachterproblematik“ auf die Probe gestellt werden, also dann, wenn man einen korrumpierenden Druck verspürt, den Erwartungen seines regelmäßigen Auftraggebers (und Geldgebers) entsprechen zu müssen.

Allgemein – also für all Aufträge zur Kriminalprognose geltend – sollte auch die Lesbarkeit, Verständlichkeit und Nachprüfbarkeit des Gutachtens, damit einhergehend auch die Nachvollziehbarkeit des gesamten Gutachtenprozesses stärker ins Bewusstsein gerufen werden. Denn die Konsistenz – im Sinne von strengem gedanklichem Zusammenhang – variiert erheblich von Gutachten zu Gutachten.

In meinen eigenen Weiterbildungsveranstaltungen lege ich verstärkt Wert auf das Erkennen fallspezifischer Besonderheiten, auf die Achtsamkeit gegenüber kognitiven Fehlern – man muss z.B. stets bereit sein, sich kontraintuitiv überraschen zu lassen! – sowie auf die Einhaltung einer gewissen Strenge bei der argumentativen und sprachlichen Herleitung von Schlussfolgerungen.

Letzten Endes entscheidet noch immer weitestgehend allein die Überzeugungskraft des Gutachtens gegenüber dem Auftraggeber, ob man als Sachverständigenperson erneut einen Auftrag erhält. Noch bleibt es also regelmäßig dem Auftraggeber vorbehalten, Konsequenzen aus der von ihm beurteilten Qualität eines Prognosegutachtens zu ziehen.

Zu einer „Best-Practice“ sollte gehören, ein Prognosegutachten mit der formalen Strenge einer wissenschaftlichen Leistung zu erstatten, mittels derer so systematisch wie möglich Daten gewonnen und interpretiert werden, um zu konkreten, fundierten und fallspezifischen Schlussfolgerungen zu gelangen.

Wie bewerten Sie die Rolle künstlicher Intelligenz und datengetriebener Modelle im Bereich der Kriminalprognose – ist das ein Fortschritt oder eine Gefahr für die individuelle Betrachtung?

Vor dem Hintergrund des Leistungsvermögens Künstlicher Intelligenz (KI) mag man sich angehalten fühlen zu prüfen, inwieweit auch die Qualität von Kriminalprognosen durch den Einsatz von KI profitieren kann. Gegebenenfalls schließt sich sogar die Frage an, inwieweit es sich ein Rechtsstaat erlauben darf, auf den Einsatz von KI zu verzichten, wenn es scheint, als könne (nur) KI dafür bürgen, dass im Rahmen der Prognoseerstellung keine rechtserheblichen Daten außer Acht gelassen oder fehlerhaft gedeutet werden.

KI scheint nicht nur hinsichtlich dessen, was es zu beachten imstande ist, sondern auch in Bezug auf das, was es auszublenden vermag, dem Menschen überlegen zu sein: Es gibt etwa keine öffentliche Erwartungshaltung, durch welche sich KI unter Druck gesetzt und zu einer entsprechend gefärbten Entscheidung gedrängt fühlen könnte.

Der Einsatz von KI zur automatisierten Lösungsfindung scheint mithin von allen menschlichen Fehlern und Unzulänglichkeiten entschlackt „reinere“ Ergebnisse zu versprechen.

Zwar ist meines Erachtens KI tatsächlich beeindruckend und nützlich, wo es um die Verarbeitung von Daten geht; KI kann gegenüber Menschen viel mehr Daten nach Art und Maß und Gleichzeitigkeit „verrechnen“. Auch macht ihr Einsatz bei geschlossener Informationsgrundlage wie z.B. im sprachlichen Bereich – so etwa auch bei der Dechiffrierung von Hieroglyphen – oder bei der Analyse von Brettspielen wie Schach oder Go m.E. durchaus Sinn.

Aber für den juristischen Bereich halte ich die Praxisrelevanz von KI, so auch für die Kriminalprognose, zumindest nach heutigem Stand, für stark „over-hyped“ und überschätzt. Aus meiner Sicht kommt ein irregeleiteter Fortschrittsglaube in Diskussionen zum Ausdruck, die sich um die Einbeziehung und Entwicklung von KI zum Zwecke der Prognoseerstellung ranken.

Es gibt nämlich Vieles, das m.E. im Umgang mit KI im Allgemeinen und auf der Folie der Kriminalprognose im Besonderen übersehen oder vernachlässigt wird.

KI vermag lediglich Ergebnisse zu imitieren, und zwar mit Hilfe von Daten, mit denen sie bis zu ihrem Einsatz aus früheren Fällen gefüttert wurde. Wenn die Daten und mit ihnen die Ergebnisse fehlerhaft waren, werden diese Unzulänglichkeiten durch KI in der Zukunft wiederholt und verfestigt.

Nicht nur würde eine arglose Repräsentation der Prognosepraxis über KI-Algorithmen zur Perpetuierung und Fortführung bisher begangener menschlicher Fehler beitragen, sondern es würde zudem auch künftigen Verschiebungen gesellschaftlicher Werte und Normerwartungen, allgemein jeglicher Änderung von Entscheidungsmaßstäben keine Rechnung mehr getragen, da für sie kein Raum vorgesehen wäre.

Zudem weist jeder Mensch eine je einzigartige Konstellation an Merkmalen in seiner Persönlichkeit und Biografie auf, die über seine Emotionen, Motivationen, sein Denken, Entscheiden, Handeln etc. in Erscheinung treten. Menschen unterscheiden sich hinsichtlich ihrer Bedürfnisse, Interessen, Begabungen, Leidenschaften, Geschmäcker etc. Man erkennt m.E. anhand der Auseinandersetzung mit KI im Kontext der Prognosebegutachtung einmal mehr, wie wenig qualitative Daten sich angemessen in quantitative Daten übersetzen lassen, zumal mit Rücksicht auf ihre je konstellative Einmaligkeit.

Die entsprechende erkenntnistheoretische Problematik entzündet sich an vielen Spannungsfeldern, die mit der Unterscheidung zwischen natur- und sozialwissenschaftlichen Untersuchungsgegenständen korrespondieren. Unter anderem sind hier die Pole zwischen partikulär vs. holistisch, Erklären vs. Verstehen, Messen vs. Beschreiben, ahistorisch vs. historisch, Verhalten vs. Erleben, Labor vs. Feld und Exaktheit vs. Wahrscheinlichkeit zu nennen.

Mit der Imitierung bisheriger Ergebnisse aus den der KI bekannten Daten geht vor allem ein Problem einher, welches die Erfüllung des bereits angesprochenen und in den Sozialwissenschaften als Validität (Gültigkeit) bekannten Gütekriteriums betrifft.

Während die Reliabilität (Zuverlässigkeit) ein sozialwissenschaftliches Gütekriterium ist, das Auskunft darüber gibt, inwieweit bei wiederholter „Messung“ der gleiche Wert ermittelt wird, handelt es sich bei der Validität (Gültigkeit) um ein Kriterium, das angibt, inwieweit überhaupt das gemessen wird, was gemessen werden soll. Schon ohne KI stellt sich das Problem, dass bei wiederholter Testung ein und desselben Menschen mittels eines psychodiagnostischen Testverfahrens zwar immer wieder z.B. ein identischer Wert für „Perfektionismus“ „gemessen“ werden mag; dies würde tatsächlich dafürsprechen, dass der Test insofern reliabel (zuverlässig) ist, als immer wieder der gleiche Wert erzielt würde. Der wiederholt ermittelte identische Wert sagt indes nichts darüber aus, ob er auch überhaupt die gemeinte Persönlichkeitsdimension „Perfektionismus“ „misst“. Statt „Perfektionismus“ könnte der immer wieder gleichartig erzielte Wert beispielsweise auch die Ausprägung von „Reserviertheit“, „Dominanz“, „Ernsthaftigkeit“, „Sachlichkeit“, „Konservatismus“ oder „Anspannung“ oder mehrere dieser Dimensionen zusammengenommen – mit je unterschiedlichem Gewicht – repräsentieren. Alle diese begrifflich differenzierbaren Dimensionen betreffen je unterschiedliche Qualitäten und Bedeutungen, die von Etikettierungen abhängen, welche allein durch Menschen vorgenommen werden können. Es fehlt der KI ein (sozial)psychologisches Sensorium, mittels dessen sie begrifflich zur qualitativen Differenzierung der Bedeutungen dieser Dimensionen fähig wäre. Die Etikettierungen der Kategorien und die entsprechenden Zuordnungen von Werten betreffen der subjektiven menschlichen Lebenswelt entlehnte und nur ihr zugängliche, und nicht etwa quantitative Unterscheidungen, die sich KI nach mathematischen Regeln selbst erschließen könnte.

Um sicher zu gehen, dass ein Wert, den ein Algorithmus hervorbringt, auch das betrifft, was man durch KI ermitteln (lassen) will, bedürfte es daher immer eines externen Kriteriums, das nicht bereits in den Daten aufgeht, welche die KI verwendet. Ein entsprechendes Kriterium muss und kann aber wiederum allein durch Menschen gewählt und von außen angelegt werden. Aus sich selbst heraus ist es KI nicht möglich zu bestimmen, ob und inwiefern die von ihr ermittelten Werte Geltung, eben Validität für das aufweisen, was sie messen soll.

In Auseinandersetzung mit dieser Problematik rührt man gedanklich an den uns Menschen zugänglichen Grenzen dessen, was unsere Lebensform kennzeichnet und uns wohl auf unabsehbare Zeit rätselhaft bleiben wird. Ich spreche von den Grenzen, die uns formal und inhaltlich durch das vorgegeben sind, was wir unser Bewusstsein nennen. Ein Bewusstsein weist KI nicht auf und wird auch insoweit den Menschen kaum je imitieren können, denn, wie der Physiker Roger Penrose einmal sagte: „Consciousness is not computational.“ Ich würde das so übersetzen: Bewusstsein geht nicht in der Verarbeitung von Daten auf. KI vermag insbesondere nicht dem allumfassenden Bewusstseinsphänomen des Verstehens gerecht zu werden.

Damit wird eine weitere Problematik von KI im vorliegenden Kontext gestreift (die Thematik ist ein denkbar weites Feld, das sich hier nur oberflächlich und stichprobenartig an einzelnen Grenzpunkten markieren lässt): Sollte ein Mensch, über den mittels einer Prognoseeinschätzung eine tief in sein Leben eingreifende Einschätzung abgegeben wird, nicht die Möglichkeit haben, sich zu wehren, in dem er einen Menschen, einen Vertreter seinesgleichen, zur Verantwortung, zur Rechenschaft für diese Einschätzung zu ziehen vermag? KI kann nicht zur Rechenschaft gezogen werden.

Das Strafrechtssystem ist durchdrungen von der Annahme, den Menschen konstituiere in erster Linie seine Autonomie, wie sich aus dem Umkehrschluss zur Schuldunfähigkeit bzw. verminderten Schuldfähigkeit ergibt.[2] Die Fähigkeit des Menschen, selbstbestimmte Entscheidungen zu treffen, wird auch von moralphilosophischer Seite als intrinsischer Wert angesehen. Es scheint allgemeine Einigkeit darüber zu bestehen, dass es zur reziproken Solidarität unter Bürgern gehören muss, es nur Menschen und nicht auch Maschinen zuzugestehen, über andere Menschen zu „richten“, also Prognoseentscheidungen zu treffen, denn nur dann kann „jemand“, d.h. ein mit Steuerungsfähigkeit ausgestatteter Mensch, für die Interessenverletzung gegenüber einem anderen Menschen zur Rechenschaft gezogen werden. Es ist kein Zufall, dass ausnahmslos alle Straftatbestände sich auf Interessenverletzungen an Menschen durch (andere) Menschen beziehen.

Auch würde man nie sicher sagen können, ob durch Algorithmen getroffene Prognoseentscheidungen alle erheblichen Aspekte in der von uns Menschen vorgesehenen, genauer, in der von uns wissenschaftlich und rechtsstaatlich vorgesehenen Weise berücksichtigt und verarbeitet würden.

Selbst dann, wenn wir hypothetisch regelmäßig davon ausgehen könnten, dass KI jeweils zu einem Fall vollständig die zur Verfügung stehenden Datensätze verwendete und würdigte und wir zudem die erzielten Ergebnisse regelmäßig für sehr gut vertretbar halten würden, stellte sich das Problem, dass KI ihre Ergebnisse über Black Boxes erzeugt:

Gerade bei der Anwendung innerhalb komplexer Materie werden Algorithmen schnell intransparent. Für anwendende oder programmierende Personen kann es oft schwierig zu rekonstruieren sein, warum ein Algorithmus ein bestimmtes Ergebnis liefert und nicht ein anderes. Dass es KI möglich ist, Algorithmen zu bilden, heißt ja nicht, dass diese Algorithmen dann auch dem menschlichen Verständnis zugänglich sind. Im Gegenteil, die Komplexität von Algorithmen steigt regelmäßig mit dem Anspruch und Bedürfnis, aufgrund der Komplexität eines Gegenstandes sich von diesen Algorithmen an die Hand nehmen zu lassen. Der KI-Algorithmus stellt aber dann meist eine Black Box dar, die – nicht nur, aber auch: – aus rechtsstaatlicher Sicht zu wünschende Prinzipien der Transparenz und Öffentlichkeit vermissen lässt.

Ein Prognoseergebnis kann für uns Menschen aber nur dann wissenschaftlichen und rechtsstaatlichen Anforderungen genügen, wenn wir uns gewiss sein können, dass es bei der Ergebnisfindung mit „rechten Dingen“ zugegangen ist, das Ergebnis nicht nur materiell richtig, sondern auch formal auf eine nicht nur gebilligte, sondern vorgesehene Weise zustande gekommen ist. Dies ist jedoch bei Black Boxes gerade nicht der Fall. Nicht ohne Grund wird in den Sozialwissenschaften Validität auch mit „argumentativer Belastbarkeit“ umschrieben. In dem Maße, wie sich die Validität – also die Antwort auf die Frage danach, ob KI wirklich die Ergebnisse erzeugt, die es erzeugen soll – nicht bestimmen lässt, immunisiert sich KI in unzulässiger Weise gegenüber kritischen Einwänden und erfüllt weder aus wissenschaftlicher noch aus rechtsstaatlicher Sicht gebotene Ansprüche des Begründungsgebots. Es fehlte jegliche argumentative Belastbarkeit. Wie Prognoseergebnisse der KI überhaupt zustande kommen, bliebe unbekannt, denn der Mensch hätte seine Hoheit über die Deutung von Daten an die KI abgegeben.

Mir drängt sich der Eindruck auf, dass viele Menschen einem Ergebnis schon dann mehr zuzustimmen geneigt sind, wenn es als von KI stammend etikettiert wird und es auf einem angeschlossenen Computerbildschirm angezeigt wird statt auf einem Blatt Papier, während sie weder wissen noch hinterfragen, wie das Ergebnis eigentlich zustande gekommen ist. Zugespitzt ausgedrückt scheint mir, dass ein unter diesen Umständen präsentiertes Prognoseergebnis am Ende auch lediglich per Zufallsgenerator zustande gekommen sein und akzeptiert werden könnte.

Darüber hinaus etwas zu Sinn und Unsinn von KI zu sagen, steht mir in diesem weiten, tiefen und komplexen – und wahrlich interessanten – Feld fachlich nicht zu. Das überlasse ich gerne lieber Experten, wobei ich mir konkret erlaube, auf die Philosophin und Physikerin Dr. Carina Prunkl, Assistant Professor for Ethics of Technology an der Universität Utrecht, als einschlägig profilierte Fachperson zu verweisen, aus deren Arbeiten sich mein auf den vorliegenden Kontext der Kriminalprognose gewendetes Verständnis speist; für sämtliche Unzulänglichkeiten meiner Ausführungen trage ich freilich die alleinige Verantwortung.

Inwieweit fließen dynamische Faktoren wie Therapieentwicklung oder soziales Umfeld in Ihre langfristige Gefährlichkeitsbeurteilung ein – und wie oft werden solche Einschätzungen aktualisiert?

In die Kriminalprognose fließen entsprechende dynamische Faktoren regelmäßig ein, wobei es vom jeweiligen Fall abhängt, ob ihnen erhöhte oder gar entscheidende Bedeutung zukommt.

Da meine Prognose nur zu einem Zeitpunkt vor der (und für die) Zukunft gestellt wird, bleibt mir die konkrete weitere Entwicklung dieser Faktoren in der Regel verborgen. Ich gebe in meinen Gutachten aber selbstverständlich an, auf welche (Zwischen-)Ziele hinzuarbeiten ist, wann mit deren Eintritt zu rechnen ist bzw. sein sollte sowie ob und gegebenenfalls unter welchen Umständen vor der Entlassung noch ein weiteres Gutachten notwendig werden könnte.

Gibt es Fälle, in denen Sie selbst überrascht wurden – etwa durch einen Täter, bei dem die Prognose eindeutig negativ war, der sich aber vollständig resozialisierte? Oder umgekehrt? Was lernen Sie aus solchen Ausnahmefällen?

Zum Glück habe ich bisher keinen Fall erlebt, bei dem ich nach meiner eigenen Prognosestellung (böse) überrascht wurde.

Ich bin aber durchaus des Öfteren über Akteninhalte oder mündliche Berichte mit Entwicklungen konfrontiert worden, die mir bestätigten, was ich mir selbst immer wieder vor Augen zu halten versuche: dass man mit allem rechnen muss und immer bereit sein sollte, sich überraschen zu lassen.

Ein Fall, der mir z.B. stark in Erinnerung geblieben ist, bezieht sich auf einen Gewalttäter, der in noch jungem Erwachsenenalter zu zehn Jahren Freiheitsstrafe verurteilt wurde. Bei Haftantritt hatte er lediglich einen Hauptschulabschluss, für den er zwei Anläufe in der 9. Klasse gebraucht hatte. Er entschied sich nun dafür, die mit Anfang 20 Jahre angetretene Haftzeit von Beginn an konsequent für seine Ausbildung zu nutzen und konstruktiv an seiner Lebensführung zu arbeiten. Im Laufe der folgenden Jahre absolvierte er nacheinander: den Realschulabschluss, das Abitur (Hochschulreife), einen Bachelorstudiengang in Informatik. Wie man sich denken kann, musste er dazu auch vielerlei administrative Hürden überwinden. Währenddessen las er viele Bücher – deren Titel ich mir von ihm angeben ließ – zur Änderung seiner Einstellung zu vielen Lebensbereichen, die insbesondere auch Beruf und Arbeit betrafen. Als ich ihn begutachtete, hatte er sich bereits über ein Jahr über dem Zeitpunkt befunden, zu welchem er sich für eine vorzeitige Haftentlassung hätte begutachten lassen können. Aber er wollte sich lieber in Ruhe auf seine Bachelorprüfungen vorbereiten. Er musste nur noch seine Bachelorarbeit fertigstellen. Ich führte einen kleinen „IQ-Test“ mit ihm durch, für welchen ich ein entsprechendes Segment aus dem Persönlichkeitsinventar 16 PF-R verwendete: maximale Punktzahl. Er hatte sich bereits für die Zeit nach seiner Haftentlassung an verschiedenen Unis beworben für den Masterstudiengang in – ob Sie’s glauben oder nicht – Künstliche Intelligenz.

Es war und ist sehr aufbauend zu sehen, dass eine Freiheitsstrafe tatsächlich solch konstruktive Entwicklungen bewirken bzw. zumindest einen entsprechenden Rahmen bieten kann. Dieser Fall zeigt auch, dass man grundsätzlich bereit sein sollte, jedem zu einer Freiheitsstrafe verurteilten Menschen im Zweifel einen gewissen Vertrauenskredit im Hinblick auf das Potential einer günstigen Entwicklung zu gewähren. Keinesfalls sollte man einer oberflächlichen, irregeleiteten Intuition folgend die Möglichkeit tiefgreifender Änderungen bei einem Menschen ausschließen. Ohnehin stellt sich die Grenze zwischen Straffälligen und Nichtstraffälligen dünner, durchlässiger, fließender dar, als es in medialen Darstellungen aller Art suggeriert wird.

Wenn Sie eine kriminalprognostische Software entwickeln dürften, welche menschliche Fähigkeit oder Eigenschaft würden Sie ihr nicht beibringen – und warum?

Das ist eine interessante Frage, die mir allerdings schwer zu beantworten fällt. Ich glaube, ich halte letztlich alle menschlichen Fähigkeiten oder Eigenschaften als potentiell hilfreich. Selbst auf jene Eigenschaften, denen wir Menschen unsere Vorurteile verdanken, sind wir möglicherweise angewiesen, etwa um prüfbare Hypothesen bilden zu können. Auch halte ich übrigens ein „Bauchgefühl“ nicht von vornherein für schlecht, insofern sich in diesem unter anderem miteinander verwoben menschliche Erfahrung, Solidarität, Schutzinstinkte, auch fachliches Verständnis als Prüfinstanz und Korrektiv bündeln. Das heißt freilich nicht, dass ich propagiere, als Sachverständigenperson seinem Bauchgefühl blind zu folgen. Selbstverständlich muss man für kontraintuitive Einsichten offenbleiben und jederzeit bereit sein, rationales Verstehen in ein womöglich zunächst widerstrebendes (Bauch-)Gefühl übergehen zu lassen; es wäre selbstverständlich absurd zu sagen: „2 plus 3 mag zwar mathematisch 5 sein, aber es fühlt sich halt einfach irgendwie nicht richtig an.“ Es wird sich nicht vermeiden lassen, das Bauchgefühl in eine Prognoseeinschätzung mit einfließen zu lassen und man sollte sogar bewusst auf sein Bauchgefühl achten – auch als Sachverständigenperson bleibt man hoffentlich in erster Linie Mensch –, aber es sollte das Ergebnis beileibe nicht diktieren.

Ich würde mich am Ende auf die Frage wenig originell herausreden mit der Antwort, dass ich der Software zum einen nicht die Begrenztheit der menschlichen Verarbeitungskapazität und zum anderen ihr nicht beibringen würde, der öffentlichen Meinung in einem konkreten Fall Gewicht zu geben. Über die Hintertür habe ich damit die, soweit für mich ersichtlich, wesentlichen Vorteile benannt, die ich Software gegenüber der menschlichen Leistungsfähigkeit im Rahmen der Prognoseerstellung zugestehe.

Das Gespräch mit Dr. Martin Brandenstein macht deutlich: Kriminalprognostik ist kein mechanisches Verfahren, sondern eine anspruchsvolle, von Verantwortung geprägte Tätigkeit, die der ständigen kritischen Reflexion bedarf. Weder technische Hilfsmittel noch standardisierte Instrumente können die notwendige individuelle Betrachtung und professionelle Urteilskraft ersetzen. Gerade in einem Bereich, in dem es um tief in die Grundrechte eingreifende Entscheidungen geht, braucht es ein hohes Maß an fachlicher Sorgfalt, ethischem Bewusstsein und Transparenz. Das Interview liefert dafür wertvolle Impulse – für Gutachterinnen und Gutachter ebenso wie für Justiz, Politik und interessierte Öffentlichkeit.

[1] Vgl. § 14 1. Halbsatz öStPO, § 261 dStPO, Art. 10 Abs. 2 chStPO

[2] § 11öStGB, §§ 20, 21 dStGB, Art. 19 chStGB.

Martin Brandenstein wird im November 2025 in Wien bei der Veranstaltung „Aussage gegen Aussage“ seine Expertise einbringen. Hier finden Sie nähere Informationen dazu: https://www.ash-forum.at/site/veranstaltungen/eventman.event/195.html/

20251120_21_tagungsprogramm_aussagegegenaussage-7

Gefährlich oder ungefährlich? Die Grenzen der Kriminalprognose.

Published by Markus Drechsler

Schreibe einen Kommentar Antworten abbrechen