Pawlows Hunde und die Wissenschaft der Konditionierung

In einem Labor in St. Petersburg beschäftigte sich um 1901 ein russischer Physiologe mit einem zutiefst praktischen Problem: wie das Verdauungssystem seine Säfte produziert. Um den Speichelfluss genau zu messen, hatte sein Team den Hunden kleine Fisteln eingesetzt, die den Speichel in Auffangröhrchen leiteten, sodass jeder Tropfen gewogen und gezählt werden konnte. Der Aufbau funktionierte hervorragend, bis auf eine störende Unregelmäßigkeit. Die Hunde begannen zu speicheln, bevor irgendein Futter ihre Zunge berührte. Sie sabberten beim Anblick des Pflegers, der gewöhnlich den Napf trug, beim Geräusch seiner Schritte im Flur, sogar beim Klappern des Fütterungsapparats, der gerade vorbereitet wurde.

Für die meisten Experimentatoren war das Störrauschen, eine unangenehme Verunreinigung der Daten, die man ausschalten musste. Iwan Pawlow tat etwas Selteneres. Er beschloss, dass die Verunreinigung der interessante Teil war. Worauf er gestoßen war, war kein Fehler in seinen Verdauungsexperimenten, sondern ein Zugang zu einer Frage, die die Physiologie noch nicht zu stellen gelernt hatte: Wie kommt es, dass ein Tier auf ein Signal reagiert, das für sich genommen überhaupt nichts bedeutet? Diese eine Verschiebung der Aufmerksamkeit verwandelte einen undichten Speicheltropfen in das Gründungsexperiment eines der dauerhaftesten Rahmenwerke der Psychologie.

Vom Verdauungstrakt zum bedingten Reflex

Iwan Pawlow wurde 1849 geboren und in der strengen Tradition der Physiologie des neunzehnten Jahrhunderts ausgebildet, einer Schule, die exakte Messung und physikalische Erklärung höher schätzte als vages Gerede über Geist oder Seele. Von seiner Herkunft her war er überhaupt kein Psychologe. Seine große frühe Leistung war eine akribische Beschreibung, wie die Verdauungsdrüsen auf ein Stichwort hin absondern, eine Arbeit, sorgfältig genug, um ihm 1904 den Nobelpreis für Physiologie oder Medizin einzubringen. Als der Preis eintraf, hatten sich seine Interessen bereits dem Rätsel des vorweggenommenen Speichels zugewandt.

Pawlow ging diese neue Frage mit demselben Instinkt an, der ihm bei seiner Verdauungsforschung gedient hatte. Er wollte etwas, das er kontrollieren, quantifizieren und wiederholen konnte, also stellte er die Situation absichtlich her, statt zu warten, dass sie zufällig eintrat. Er ließ einen Ton erklingen oder setzte ein Metronom in Gang und reichte dann, einen Augenblick später, dem Hund Futter. Nach genügend Wiederholungen speichelte der Hund allein auf den Ton hin, ohne dass Futter in Sicht war. Pawlow konnte nun die Stärke dieser erlernten Reaktion messen, indem er die Tropfen zählte, die Zeit nahm, wie schnell sie auftrat, und beobachtete, wie sie sich veränderte, wenn er die Bedingungen variierte. Er hatte ein schwer fassbares psychologisches Phänomen in ein physiologisches verwandelt, und diese Übersetzung ist ein wesentlicher Grund, warum sich seine Arbeit als so beständig erwies.

Die vier Begriffe, die den gesamten Rahmen ordnen

Die Kraft von Pawlows Rahmen kommt aus einem kleinen, präzisen Vokabular, mit dem sich nahezu jeder Fall dieser Art von Lernen beschreiben lässt. Alles ruht auf vier Begriffen, und es lohnt sich, sie ganz genau richtig zu verstehen.

Futter im Maul bringt einen Hund zum Speicheln, ohne jegliches vorheriges Training; so ist das Tier einfach gebaut. Das Futter ist der unbedingte Reiz, das, was natürlich und automatisch eine Reaktion auslöst, und der Speichelfluss, den es hervorruft, ist die unbedingte Reaktion. Keines von beiden muss gelernt werden. Ein Ton hingegen bedeutet einem hungrigen Hund anfangs nichts. Er ist ein neutraler Reiz, die Art von Sache, die das Tier vielleicht bemerkt und dann ignoriert. Das ganze Experiment besteht darin, den neutralen Ton mit dem Futter zu koppeln, wieder und wieder, bis der Ton aufhört, neutral zu sein. Sobald der Hund allein auf den Ton hin speichelt, ist der Ton zu einem bedingten Reiz geworden, und der Speichelfluss, den er nun auslöst, ist die bedingte Reaktion. Das Wort bedingt trägt hier den Sinn von abhängig, eine Reaktion, die von einer Geschichte der Kopplung abhängt und nicht von der angeborenen Verschaltung des Tieres.

So dargelegt ist die Logik fast rechnerisch. Ein unbedingter Reiz löst zuverlässig eine unbedingte Reaktion aus. Koppelt man einen neutralen Reiz oft genug mit diesem unbedingten Reiz, wird der neutrale Reiz zu einem bedingten Reiz, der von sich aus eine bedingte Reaktion auslösen kann. Die bedingte und die unbedingte Reaktion ähneln sich oft, in Pawlows Fall sind beide der Speichelfluss, aber sie sind nicht identisch und entstehen aus unterschiedlichen Ursachen. Dieser kompakte Satz von Definitionen ist das Arbeitsvokabular, das Lernende mehr als ein Jahrhundert später noch immer verwenden, und das meiste, was folgt, ist eigentlich eine Untersuchung darüber, wie sich diese Assoziationen verhalten, sobald sie sich gebildet haben.

Wie bedingte Reaktionen aufgebaut, verloren und wiedergewonnen werden

Eine bedingte Reaktion erscheint bei der ersten Kopplung nicht vollständig ausgebildet. Sie wird über wiederholte Durchgänge hinweg allmählich aufgebaut und wird stärker und zuverlässiger, je weiter bedingter Reiz und unbedingter Reiz gemeinsam eintreffen. Diese Aufbauphase heißt Erwerb, und ihr Verlauf zu beobachten erlaubt es dem Experimentator, Lernen als einen Prozess mit einer messbaren Steigung zu sehen und nicht als einen plötzlichen Schalter.

Ebenso lehrreich ist, was geschieht, wenn die Kopplung aufhört. Wenn Pawlow den Ton viele Male erklingen ließ, ohne je Futter folgen zu lassen, verblasste der bedingte Speichelfluss und verschwand schließlich. Diese Abschwächung heißt Löschung, und der Name ist leicht irreführend, denn er legt nahe, dass das ursprüngliche Gelernte ausgewischt wurde. Das aufschlussreichste Ergebnis der ganzen Abfolge zeigt, dass dem nicht so ist. Nach einer Ruhepause von Stunden oder Tagen kehrte der Speichelfluss, als der Ton erneut erklang, von selbst zurück, ohne jegliche neuen Kopplungen. Diese spontane Erholung sagt uns etwas Wichtiges über das Gedächtnis: Die Löschung tilgt nicht die ursprüngliche Assoziation, sie legt ein neues Stück Gelerntes darüber, eine erlernte Hemmung, die besagt, dass dieses Signal kein Futter mehr ankündigt. Die erste Lektion liegt noch immer darunter, und das hat geprägt, wie Psychologen darüber denken, warum Ängste und Gewohnheiten, einmal scheinbar überwunden, zurückkehren können.

Wann sich Lernen ausbreitet und wann es sich schärft

Zwei weitere Phänomene runden das Bild ab und dienten Pawlow praktischerweise zugleich als Werkzeuge, um zu ergründen, was seine Hunde wahrnehmen konnten. Das erste ist die Generalisierung. Ein Hund, der darauf trainiert ist, auf einen Ton einer bestimmten Tonhöhe hin zu speicheln, wird in geringerem Maße auch auf benachbarte Tonhöhen speicheln, die er nie in Verbindung mit Futter gehört hat. Die bedingte Reaktion breitet sich auf Reize aus, die dem ursprünglichen bedingten Reiz ähneln, und je größer die Ähnlichkeit, desto stärker die Reaktion. Das ist kein Mangel des Lernens, sondern eine vernünftige Grundeinstellung, denn in der unordentlichen realen Welt kehrt ein Signal selten zweimal in genau derselben Form wieder.

Der gegenteilige Prozess ist die Diskrimination. Wenn Pawlow den Hund konsequent nach einem bestimmten Ton fütterte, während er einen ähnlichen Ton vorspielte, dem nie Futter folgte, lernte der Hund allmählich, nur auf den verstärkten Ton zu reagieren und seine Reaktion bei dem anderen zurückzuhalten. Das gab Pawlow ein unerwartet elegantes Instrument. Indem er zwei Töne oder zwei Formen einander immer näher rückte und beobachtete, wann der Hund sie nicht mehr unterscheiden konnte, konnte er die Grenzen des Hörens oder Sehens des Tieres von außen messen und so die sensorische Schärfe an einer Speicheldrüse ablesen. Eine Methode, geboren als Untersuchung des Lernens, wurde zu einem Weg, die Wahrnehmung selbst zu befragen.

Vom Speichel eines Hundes zur Angst eines Kindes

Lange Zeit war offen, ob irgendetwas davon auf den Menschen zutraf, und besonders auf die Emotionen, die sich am persönlichsten und am wenigsten mechanisch anfühlen. Die Antwort, auf eine Weise demonstriert, die das Fach seither verstört, kam 1920. An der Johns Hopkins University arbeiteten der Psychologe John Watson und seine Mitarbeiterin Rosalie Rayner mit einem elf Monate alten Säugling, der als Little Albert in Erinnerung blieb. Das Kind zeigte anfangs keine Furcht vor einer weißen Laborratte. Watson und Rayner begannen daraufhin, jedes Mal, wenn die Ratte erschien, mit einem Hammer auf eine Stahlstange hinter Alberts Kopf zu schlagen und so ein plötzliches, erschreckendes Geräusch zu erzeugen. Schon bald brachte die Ratte allein das Kind zum Weinen und Zurückzucken, selbst ganz ohne Geräusch.

Die Zuordnung zu Pawlows Begriffen ist exakt. Das laute Scheppern war ein unbedingter Reiz, der eine unbedingte Furchtreaktion erzeugte; die Ratte, anfangs neutral, wurde zu einem bedingten Reiz, der bedingte Furcht auslöste; und die Furcht generalisierte sogar, wobei Albert sich Berichten zufolge auch von anderen pelzigen Dingen verstören ließ, auf die er nicht trainiert worden war. Das Experiment zeigte, dass menschliche emotionale Reaktionen, nicht nur Drüsenreflexe, klassisch konditionierbar sind. Es war außerdem nach jedem modernen Maßstab ein schwerwiegendes ethisches Versagen: Ein schutzbedürftiger Säugling wurde absichtlich in Furcht versetzt, ohne klaren Plan, den Schaden wieder rückgängig zu machen. Das Unbehagen, das die Studie noch immer auslöst, ist ein Teil davon, warum sie in den Lehrbüchern fortlebt, denn die Empörung, die sie erzeugte, trug dazu bei, die Psychologie zu den formalen Standards der Forschungsethik zu drängen, einschließlich der informierten Einwilligung und des Schutzes der Teilnehmer, die das Fach heute regeln.

Konditionierung in freier Wildbahn und in der Klinik

Sobald man das Vokabular hat, beginnt man, klassische Konditionierung überall im Alltag zu sehen, besonders in unseren automatischen emotionalen und physiologischen Reaktionen. Die Reize, die mit einem Verlangen verbunden sind, eine bestimmte Straßenecke, eine Tageszeit, ein Geruch, können das Verlangen von sich aus auslösen, lange nachdem die Substanz verschwunden ist. Angst kann sich an eine bestimmte Situation heften, die einst mit etwas wirklich Bedrohlichem zusammenfiel. Ein anschauliches Beispiel ist die bedingte Geschmacksaversion, bei der eine einzige Lebensmittelvergiftung ein einst geliebtes Gericht über Jahre hinweg übelkeitserregend machen kann, eine starke Assoziation, die in nur einem einzigen Durchgang entsteht. Die Reichweite der Konditionierung erstreckt sich sogar bis ins Immunsystem, denn Labortiere lassen sich so trainieren, dass ein neutraler Geschmack, gekoppelt mit einem immunsuppressiven Medikament, schließlich von sich aus die Immunaktivität dämpft.

Zwei klinische Therapien machen aus diesen Prinzipien eine Behandlung, indem sie in entgegengesetzte Richtungen wirken. Die Aversionstherapie installiert absichtlich eine neue Assoziation, indem sie ein unerwünschtes Verhalten mit einem unangenehmen unbedingten Reiz koppelt, sodass sich das Verhalten selbst zu widern beginnt. Die Expositionstherapie führt die Logik der Löschung an der Angst des Patienten umgekehrt aus: Sie präsentiert den gefürchteten bedingten Reiz wiederholt, sicher und ohne dass die angedrohte Folge je eintritt, sodass die fehlangepasste bedingte Reaktion allmählich schwächer wird. Dieselbe Mechanik, die Albert lehrte, eine Ratte zu fürchten, kann, sorgfältig und ethisch gehandhabt, jemandem helfen, eine Phobie zu verlernen.

Wo die Konditionierung im Gehirn wohnt und wo sie aufhört

Pawlows Rahmen war vollständig aus dem Verhalten aufgebaut, doch die spätere Neurowissenschaft hat einen Großteil davon in bestimmtem Hirngewebe verortet. Zwei Substrate sind besonders gut beschrieben. Das Kleinhirn trägt motorische bedingte Reaktionen, das sauberste Beispiel ist der bedingte Lidschlag, bei dem ein Ton, gekoppelt mit einem Luftstoß ins Auge, schließlich von sich aus ein schützendes Blinzeln auslöst. Die Amygdala wiederum ist zentral für bedingte Furcht, und das gilt bemerkenswert beständig bei Säugetieren, von Ratten bis zum Menschen. Beschädigt man diese Strukturen, kann sich die entsprechende Form der Konditionierung nicht ausbilden, was ein starker Beleg dafür ist, dass Pawlows Abstraktionen einer realen Maschinerie entsprechen und nicht bequemen Metaphern.

Ebenso wichtig ist, sich darüber im Klaren zu sein, was die klassische Konditionierung nicht erklärt. Sie ist schließlich nur eines der Lernparadigmen der Psychologie, und sie erfasst speziell unwillkürliche, reflexartige Reaktionen, die Dinge, die ein Körper tut, und nicht die Dinge, die ein Organismus zu tun wählt. Sie sagt wenig darüber, wie ein Tier lernt, eine brandneue willkürliche Handlung auszuführen, um eine Belohnung zu erlangen, wie es durch das Beobachten eines anderen Individuums lernt oder wie es eine innere Karte des Raumes aufbaut, durch den es sich bewegt. Das sind die Gebiete der operanten Konditionierung, des Beobachtungslernens und der kognitiven Karten, eigenständige Paradigmen mit ihren eigenen Begründern und ihrer eigenen Logik. Pawlow gab uns das erste und strengste der vier, nicht das gesamte Lernen.

Die wichtigsten Erkenntnisse

Die klassische Konditionierung begann um 1901 als zufällige Beobachtung in Iwan Pawlows St. Petersburger Verdauungslabor, wo Hunde schon vor dem Eintreffen des Futters speichelten, und sie wuchs zum ersten experimentellen Rahmen für assoziatives Lernen heran, dem Werk eines Physiologen, der bereits 1904 den Nobelpreis gewonnen hatte. Ihr Kern ruht auf vier Begriffen: ein unbedingter Reiz, der natürlich eine unbedingte Reaktion erzeugt, wiederholt gekoppelt mit einem anfangs neutralen Reiz, bis dieser Reiz zu einem bedingten Reiz wird, der von sich aus eine bedingte Reaktion auslösen kann. Diese Assoziationen werden durch Erwerb aufgebaut, durch Löschung abgeschwächt und durch spontane Erholung als fortbestehend erwiesen, während die Generalisierung die Reaktion auf ähnliche Reize ausbreitet und die Diskrimination sie auf einen einzigen schärft. Watsons und Rayners ethisch unvertretbare Little-Albert-Studie von 1920 bewies, dass menschliche Emotionen konditionierbar sind, und half, das Fach zu einer modernen Forschungsethik zu drängen, und dieselben Prinzipien erhellen heute Süchte, Ängste, bedingte Geschmacksaversionen und sogar bedingte Immunreaktionen und liegen der Aversions- und der Expositionstherapie zugrunde, wobei das Kleinhirn motorische bedingte Reaktionen trägt und die Amygdala die bedingte Furcht. So mächtig sie auch ist, die klassische Konditionierung erklärt nur unwillkürliche, reflexartige Reaktionen, eines von vier Paradigmen, und überlässt willkürliches Handeln, Lernen durch Beobachtung und räumliche Karten anderen Erklärungen.

Learn more with Mindoria

Bite-sized lessons, spaced repetition, and live PvP trivia battles. Free on Android.

Download Free