Forschungsmethoden Blog/Vortrag zur ergebnisorientierten quantitativen Forschung

Zurück zur Folie Ergebnisorientierte quantitative Forschung

Einführung

Wir haben uns im vorigen Kapitel mit den Grundlagen der Psychotherapieforschung - qualitativ wie quantitativ - auseinander gesetzt. Der erste Hauptstrang der Forschung, den wir uns zugewendet haben, war die der Prozessforschung, denn diese ist für Personen, die in Ausbildung sind, von unmittelbarem Interesse.

Ausbildungskandidat_innen sind von der Wirksamkeit der Psychotherapie überzeugt, warum sonst würden sie sich ausbilden lassen? Es ist dennoch oft mit ambivalenter Haltung, dass über die Wirksamkeit diskutiert wird: Entweder um gegenüber Bekannten den großen persönlichen Einsatz in die Ausbildung zu rechtfertigen, oder als notwendiges Übel, um finanzielle Unterstüzung für die Patient_innen zu erwirken.

Aus diesen und anderen Zusammenhängen sieht man, dass die Frage nach der Wirksamkeit der Psychotherapie von großem gesellschaftspolitischen Interesse ist. Wie wir im ⚠ %popwin id=5 width=1000 height=500%[[Grundlage.Grundlage?skin=triad|ersten Kapitel]] gesehen haben, leben wir in einer Kultur, die der Wissenschaftlichkeit großen Wert beimisst und speziell stark auf das naturwissenschaftliche Paradigma schielt. Im Gesundheitsbereich hat sich dies in die Forderung nach einer evidenzbasierten Medizin kristallisiert. Und da die Medizin im Gesundheitsbereich eine hegemonische Rolle spielt, wird diese Erwartung auf andere Gesundheitsberufe übertragen. Schauen wir uns dies noch genauer an:

Evidenzbasierte ergebnisorientierte Forschung

Eine der ersten groß angelegten ergebnisorientierten quantitativen Forschung war die Arbeit von ⚠ %popwin id=4 width=800 height=500%[[Inhalt.ErgebnisorientiertQuantitativReferenzen?skin=triad|Eysenck aus dem Jahr 1952]]. Diese Metastudie umfasste 7.000 Patient_innen und erwies eine negative(!) Wirkung der Psychoterapie.
Heute ist allerdings die methodenunabhängige Wirksamkeit der Psychotherapie erwiesen. Wie kam Eysenck dann zu diesem falschen Ergebnis? Diese Pionierforschung weist viele der Fehler auf, die man nur machen kann:

Die Forschung verwendete ein unklares und subjektives Messverfahren, nämlich die persönliche subjektive Beurteilung des behandelnden Psychiaters;
Sie hatte keine Kontrollgruppe;
Der Faktor Zeit/Therapiedauer wurde nicht berücksichtigt;
Die Forscher waren zugegebenermaßen voreingenommen;
Auch wenn die Stichprobe sehr groß war, wurde keine Fehleranalyse gemacht, und somit wurden systematische Fehler übersehen.

Es stellte sich also die Frage, wie können wir es besser machen? Nach dieser Blamage bemüht sich die ergebnisorientierte quantitative Psychotherapieforschung daher sehr stark darum, evidenzbasiert zu sein.

Unter "evidenzbasiert" ist ein "gewissenhafter, ausdrücklicher und umsichtiger Gebrauch der aktuellen besten Erkenntnisse für Entscheidungen bezüglich der Versorgung eines Einzelpatienten" gemeint ⚠ %popwin id=4 width=800 height=500%[[Inhalt.ErgebnisorientiertQuantitativReferenzen?skin=triad|(Sackett et al. 1996)]].

Bei dieser Definition ist anzumerken, dass das Wort "Evidenz" gar nicht vorkommt. Zu Recht, denn wir haben schon gesehen, wie problematisch solche Begriffe wie "Objektivtät" sind. Stattdessen ist von "besten Erkenntnissen" die Rede. Weiters bezieht sich die Definition auf "Einzelpatient_in". Somit sind die wichtigsten Vorbehalte an der evidenzbasierten Forschung vom Tisch. In seiner Urform hat der evidenzbasierte Zugang nicht die Mechanik als Paradigma, er sieht weder seine Erkenntnisse als Wahrheit/Dogma, noch entpersonalisiert er die Patient_in. Es bleibt unvoreingenommen zu sagen, dass konkrete Forschungen dies vergessen, und dass die gesellschaftliche Rezeption ein anderes Bild malt.

Die evidenzbasierte Forschung macht häufig von ⚠ %popwin id=7 width=1000 height=500%[[https://de.wikipedia.org/wiki/Randomisierte_kontrollierte_Studie?skin=triad|randomisierten kontrollierten Studien (RKS)]] Gebrauch. Die Grundlage solcher Studien ist einerseits die "Randomisierung", die zufallsbestimmte Zuordnung der Fälle (zum Beispiel ob eine bestimmte Patient_in ein Medikament oder ein Placebo bekommt, entscheidet der Zufall), und andererseits der Vergleich mit einer Kontrollgruppe (in diesem Fall, derer die Placebo bekommen haben).

Evidenzhierarchie

Auch wenn die RKS-Anordnung in der Psychotherapie viel schwerer zu konstruieren ist als in der Medizin, wird sie auch hier als Goldstandard gesehen. Wir können die Forschungsmethoden wie in der Tabelle anordnen (aus ⚠ %popwin id=4 width=800 height=500%[[Inhalt.ErgebnisorientiertQuantitativReferenzen?skin=triad|Referenz 3]] übertragen, auf der dieses Kapitel basiert):

Versuchsanordnung	Defnition	Stärke	Schwäche
Einzelfall-Studie	Die Intervention wird an einer Person angewendet und die Veränderung wird beschrieben	einfach, praxisnahe	Ausreichend nur, wenn die Veränderung ohne die Intervention mit Sicherheit bekannt ist
Fallserie	Eine Reihe von Personen bekommt die gleiche Intervention	Stichprobenumfang ist größer und die Streuung daher kleiner; Ansatzweise Aussage über Wirksamkeit	Kein expliziter Vergleich mit der Unterlassung der Intervention
Historisch kontrollierte Studie	Vergleicht eine Stichprobe mit älteren Fällen, wo die Intervention nicht verfügbar war	Erzeugt einen expliziten Vergleich	Gesundheitsdienstleitungen und Eigenschaften der Bevölkerung können sich verändert haben
Fall-Kontroll-Studie	Auswahl von Kontrollfällen, die mit bekannten Störfaktoren zusammenhängen	Basiert auf historischen Tendenzen	Unbekannte Störfaktoren sind naturgemäß unmöglich zu kontrollieren
Randomisierte Kontrollstudie	Eine Stichprobe wird zufällig zwei unterschiedlichen Interventionen zugeteilt	Kann eine gute Balance zwischen bekannten und unbekannten Störfaktoren bilden	Zuweisende Psychotherapeut_in versucht die Randomisierung zu umgehen
Randomisierte Kontrollstudie mit Verblindung	Die Randomisierte Zuordnung bleibt der Psychotherapeut_in unbekannt	Bildet eine gute Balance zwischen bekannten und unbekannten Störfaktoren	Zuweisende Psychotherapeut_in kann immer noch versuchen Randomisierung zu umgehen

Diese Reihung will keinen Hinweis auf die Qualität der Forschung implizieren. Außerdem können sich je nach Fragestellungen unterschiedliche Forschungsanordnungen als zweckmäßig darstellen. Für Fragen der Wirksankeit sind die unteren Reihen für quantitative Aussagen relevanter, denn dabei ist die Fehlerstreuung kleiner. Die Fehlerstreuung ist nur kleiner und nicht null, denn randomisierte Kontrollstudien unterliegen wie jede wissenschaftliche Studie den wissenschaftlichen Grenzen und können daher bestenfalls falsifiziert werden.

Eine weitere Möglichkeit, die Streuung zu reduzieren, bieten Metastudien. In diesen werden viele Studien zusammen betrachtet. Diese Strategie ist sehr wirksam je besser die Studien vergleichbar sind. Dazu müssen die Messinstrumente übereinstimmen, müssen die Populationen ähnlich sein, müssen die Fehleranalysen vergleichbar sein. Wir sprechen in diesem Fall von "statistischer Homogenität". Diese ist schwer zu gewährleisten, und sie sollte den Vorrang gegenüber der Größe der Stichprobe haben. Soll heißen, wenn ich die Wahl habe zwischen einer Metaanalyse von vielen weniger homogenen Studien und von weniger aber homogeneren Studien, sollte zweiteres vorgezogen werden.

Diskussion im Plenum

Wozu brauchen wir randomisierte kontrollierte Studien?

Randomisierung?

Es gibt große Diskussion - auch in der Medizin - darüber, ob RKS immer der Goldstandard sind und ob sie überhaupt einsetzbar sind.

Denke zum Beispiel an die Frage ob Fallschirme für den Sprung aus einem Flugzeug wirksam sind - es wäre absurd eine Kontrollgruppe von Personen zu verwenden, die ohne Fallschirm springen. Hier wäre eine historische Studie angebrachter: Die Erfahrung von Personen, die vom Flugzeug ohne Fallschirm gefallen sind, wäre als Kontrollgruppe eher geeignet. Auch wenn wir sie weder randomisieren, noch die Störfaktoren homogenisieren können.

Besserung vs. Dauer ⚠ %popwin id=4 width=800 height=500%[[Inhalt.ErgebnisorientiertQuantitativReferenzen?skin=triad|(Referenz 3)]]

Kontrollgruppe?

Eine andere Sache ist die Sinnhaftigkeit einer Aussage ohne Kontrollgruppe. Betrachte zum Beispiel die Frage ob die Besserung von Patient_innen mit der Anzahl der Sitzungen zusammenhängt. In der Graphik sehen wir eine eindeutige Besserung mit der Zeit, in den ersten Stunden findet eine größere Steigerung statt, die noch bis zum Ende hin besteht.

War dies aber der Effekt von der Psychotherapiebehandlung? Aus der Graphik allein können wir es nicht sagen, denn wir wissen nicht, wie es ohne die Behandlung gewesen wäre. In der nächsten Graphik haben wir nun eine Kontrollgruppe eingeführt:

Effekt vs. Dauer ⚠ %popwin id=4 width=800 height=500%[[Inhalt.ErgebnisorientiertQuantitativReferenzen?skin=triad|(Referenz 3)]]

Im ersten Fall wäre die Besserung nur auf Grund der Therapie erfolgt. Die Besserung ist mit dem Effekt der Therapie gleich zu setzten. Das ist eher realitätsfern, denn die meisten Menschen erleben eine Besserung auch ohne psychotherapeutische Behandlung. Fall b würde eine solche Situation darstellen, in der der Effekt der Therapie sehr groß ist. Vorstellbar wäre aber auch Fall c, wo die Therapie immer noch hilfreich ist, aber nicht in solch einem Ausmaß wie im vorherigen Fall. In Fall d ist der Effekt der Therapie negativ - die Leute hätten sich schneller verbessert, wenn sie keine Therapie in Anspruch genommen hätten. Die letzten zwei Fälle erlauben differenziertere Aussagen: in e ist der Effekt der Therapie eine schnelle Besserung, in f setzt sich die Besserung anfangs gleich schnell ein, mit der Therapie wird aber ein höheres Niveau erreicht.

Wie wir in diesem Beispiel gut sehen, ist die Forschungsaussage ohne Kontrollgruppe sehr arm, erst die Kontrollgruppe ermöglicht detaillierte und zuverlässige Ergebnisse.

Große Stichproben?

Es ist intuitiv verständlich, dass je größer die Stichprobe, desto größer ist auch die Zuverlässigkeit der Ergebnisse.
In der Praxis arbeiten die meisten Psychotherapieforschungen mit einer kleinen Stichprobe von circa 30 Fällen. Für groß angelegete Studien ist diese Zahl eher um 300.
Auch wenn eine große Anzahl von Fällen die statistiche Aussage verbessert, bringt sie auch viele systematische Schwierigkeiten mit, die eventuell den positiven Effekt überwiegen. Zum Bespiel ist es leichter eine homogene Erhebung von Daten durch Fragebögen für 30 Personen zu erreichen. Bei 300 müssen wir schon unterschiedliche Interviewer_innen einsetzen und haben dann Schwierigkeiten bei der Homogenisierung. Oder die Interviewer_innen werden müde und füllen die Fragebögen am Ende der Erhebung anders als am Anfang aus.

RKS in der Psychotherapieforschung

Diskussion in Kleingruppen

In der Psychotherapieforschung gibt es bekanntlich große Vorbehalte gegen randomisierte kontrollierte Studien. Hier kommen zu den Schwierigkeiten aus der Medizin noch manchen dazu, die für die Psychotherapie spezifisch sind. Die Homogenisierung der Interventionen innerhalb beider Gruppen (Effekt- und Kontrollgruppe) ist sehr schwer zu erreichen, eine "keine Intervention"/Placebo-Situation schwer zu konzipieren, die Messinstrumente sind nicht sehr aussagekräftig bezüglich der Inhalte der Arbeit, uvm..

Speziell führt der Versuch, die Intervention zu homogenisieren zu einer Art Therapie nach Handbuch, und diese erfährt in vielen Schulen große Ablehnung. Es ist so, als ob die Forschungsgenauigkeit im Gegensatz zur therapeutischen Flexibilität stünde. Sehr schnell fühlen wir uns so wie im Beispiel der Fallschirmsprünge: können wir in der Gegenwart der Not einer Klient_in eine hilfreiche Intervention weglassen, nur weil sie in der Forschung nicht vorgesehen war?

Trotz aller dieser Schwierigkeiten gibt es spezielle Situationen, wo eine RKS wohl vorstell- und durchführbar ist. Und dann ist sie besonders wertvoll. Das ist insbesondere der Fall, wenn es nicht um einen Wertbewerb ("Pferderennen") zwischen verschiedenen Methoden, oder um die Effizienz der Behandlung für die Kostenträger geht.

Effektivität vs. Effizienz

In Bezug auf die Fragen des Kostenträgers ist es wichtig diese zwei Begriffe zu unterscheiden.

Unter Effektivität verstehen wir die Wirksamkeit einer Intervention. Die Effektivität des Einsatzes von Wasser oder Champagner für die Feuerlöschung ist gleich groß.

Bei der Effizienz geht es nun um eine Kosten-Nutzen-Rechnung: Der Einsatz von Champagner als Löschmittel ist - auch wenn effektiv - höchst uneffizient. Aber das auch nur unter gewöhnlichen Umständen. Wenn wir keinen Zugang zum Wasser haben und über tausende Champagner-Flaschen verfügen, mag es eine gute Idee sein, den Champagner einzusetzen.

Also die Effektivität bezieht sich mehr auf ideelle Umstände, wo es darum geht, die bestmögliche Intervention, unbedacht der Kosten zu wählen. Das ist für Therapeut_innen und Klient_innen die relevante Größe. Effizienz dagegen ist der Parameter der Kostenträger. Sie sind dazu beauftragt, die sinvollste Intervention aus dem Blickwinckel der Volkswirtschaft zu unterstützen.

Zusammengefasst: