Der Computer hilft beim Sprachenlernen

Gängige Sprachlernprogramme setzen auf uralte Regeln der Lernpsychologie. Ein Algorithmus soll nun individuell für jeden Lernenden und jedes Wort die optimale Repetitionsrate berechnen.

Christian Honey
Drucken
An Karteikarten kam man beim Sprachenlernen in der Schule nicht vorbei. (Bild: Nathalie Taiana / NZZ)

An Karteikarten kam man beim Sprachenlernen in der Schule nicht vorbei. (Bild: Nathalie Taiana / NZZ)

Das Gedächtnis ist ein Sieb. Ob beim Erlernen einer Fremdsprache oder bei der Vorbereitung auf eine Prüfung – meist muss der Lernende neues Wissen mehrfach repetieren, bevor es im Gedächtnis hängenbleibt. Lernsoftware, Apps und Online-Plattformen werben damit, diesen Prozess des Wiederholens optimal zu gestalten. Wie oft aber und wann Vokabeln, Grammatikregeln oder Wissenshäppchen wiederholt werden, orientiert sich bei den meisten Angeboten an jahrzehntealten Faustregeln der Lernpsychologie. Nun versuchen Forscher dem optimalen Lernrhythmus mit lernenden Algorithmen auf die Schliche zu kommen.

Das Vergessen berechnen

«Aktuelle Lernangebote wie Mnemosyne, Synap und Duolingo folgen meist starren Schwellenwerten, die für alle Lernenden und alle Inhalte gleichermassen gelten», sagt Manuel Gomez-Rodriguez vom Max-Planck-Institut für Software-Systeme. Die Heuristiken bauen dabei auf den frühen Erkenntnissen des Psychologen Hermann Ebbinghaus auf. Im späten 19. Jahrhundert führte Ebbinghaus Selbstversuche durch, bei denen er zufällig angeordnete Silben-Reihen auswendig lernte. Dabei fiel ihm auf, dass er die Reihen umso langsamer vergass, je länger eine Lernsitzung zurücklag und je öfter er den Inhalt wiederholt hatte. Die «Vergessenskurven», die Ebbinghaus aus diesen Beobachtungen ermittelte, sind noch heute Gegenstand jedes Psychologie-Grundstudiums.

Zur Optimierung des Lernens schlug Ebbinghaus eine «Ersparnismethode» vor: Erlerntes wiederhole man am besten in wachsenden Abständen. Verschiedene Varianten dieser Methode haben sich seither etabliert. Im Jahr 1967 etwa schlug der New Yorker Linguist Paul Pimsleur vor, beim Spracherlernen das Vokabular in exponentiell zunehmenden Abständen anzuhören. Mit der Audiokassette verbreitete sich Pimsleurs Methode bald weltweit. Wenig später, im Jahr 1972, stellte der deutsche Publizist Sebastian Leitner sein heute berühmtes Karteikartensystem vor. Dabei stehen je eine Frage und ihre Antwort (z. B. eine Vokabel und ihre korrekte Übersetzung) auf den beiden Seiten einer Karteikarte. Erinnert sich der Lernende bei der Wiederholung der Karte korrekt, rückt sie in der Kartei eine Abteilung weiter nach hinten. Karten, die vorne liegen, werden häufiger wiederholt. Auch wenn die Algorithmen der aktuellen Sprachlernangebote etwas ausgefeilter sind als die Karteikartenmethode, beruhen sie effektiv auf diesem alten System.

Gomez-Rodriguez und seine Mitarbeiter schlagen nun in den «Proceedings of the National Academy of Sciences» einen neuen Ansatz vor. «Unser Algorithmus kann für jeden Lerninhalt und jeden Lernenden eine eigene optimale Wiederholungsfrequenz aus den beobachteten Vergessensraten berechnen», sagt Gomez-Rodriguez. Trainiert hat sein Team den Algorithmus auf Lerndaten der Sprachlernplattform Duolingo – in diesem Fall Worte, die in Sätze einer Fremdsprache eingesetzt werden sollen. Für jede Wiederholung dieser Wort-Satz-Paare speichert die Duolingo-Datenbank den Zeitpunkt und die Korrektheit der Antwort. «Aus den Duolingo-Daten haben wir mit Methoden des Maschinenlernens für jeden Lerninhalt ein eigenes Modell der Vergessenswahrscheinlichkeit erstellt», sagt Gomez-Rodriguez. Mit diesen Wahrscheinlichkeiten fütterten die Max-Planck-Forscher dann einen Algorithmus namens Memorize, der für jeden Lerninhalt eine eigene optimierte Wiederholungsrate vorschlägt. Für eine individuelle Berechnung für jeden Lernenden waren die öffentlich zugänglichen Daten hier allerdings nicht detailliert genug.

Bessere Lernerfolge

Einen ersten Hinweis darauf, dass die optimierten Wiederholungsraten tatsächlich einen Lernvorteil mit sich bringen, zeigte ein «natürliches Experiment», wie Gomez-Rodriguez es nennt. Seit 2016 nutzt Duolingo einen Algorithmus namens Halflife-Regression, der die Wahrscheinlichkeit vorhersagt, mit der ein Nutzer die Hälfte des Erlernten wieder vergessen hat. Der Algorithmus bestimmt keine individuell optimierten Wiederholungszeitpunkte, sondern arbeitet mit festen Schwellenwerten. Doch die so bestimmten Repetitionszeiten sind so variabel, dass Gomez-Rodriguez und seine Kollegen sie zu einem Test von Memorize verwenden konnten. Der Test zeigte, dass Nutzer, deren Lernrhythmus zufälligerweise den Wiederholungsraten von Memorize ähnelte, signifikant bessere Lernerfolge hatten als jene, die einem anderen Muster folgten.

Eine Besonderheit der neuen Methode ist, dass sie auf verschiedene Modelle des Vergessens angewandt werden kann. In der experimentellen Psychologie wurden seit Ebbinghaus etliche Funktionen des Vergessens vorgeschlagen. «Die empirische Gesetzmässigkeit des Vergessens, die Ebbinghaus aufgezeigt hat, ist heute zwar gut etabliert», sagt Jan Rummel vom Psychologischen Institut der Universität Heidelberg. Aber es gebe nicht nur eine einzige mathematische Funktion, die das Vergessen beschreibe. Das liege daran, dass sich der Verlauf von Vergessenskurven mit dem Lerninhalt und dem Lernenden ändere. Dabei spiele zum Beispiel das Vorwissen eine Rolle oder in welchen Kontext der Lerninhalt eingebunden sei. Verschiedene Modelle des Vergessens beschreiben also jeweils unterschiedliche Varianten des Lernens am besten.

Für Lernforscher geeignet

Die Optimierungsmethode von Gomez-Rodriguez ist so aufgebaut, dass sie für beliebige Vergessensmodelle einen eigenen Memorize-Algorithmus produziert. Daher könne das Verfahren auch als Werkzeug in der Kognitionsforschung eingesetzt werden, etwa um zu prüfen, welches Modell des Vergessens für einen bestimmten Lerninhalt am besten geeignet sei, sagt Gomez-Rodriguez.

«Je mehr Einflussfaktoren man in ein Modell des Vergessens integriert, desto genauer werden die Optimierungsvorschläge, die ein Algorithmus daraus berechnen kann», sagt der Kognitionsforscher Rummel. Das habe aber seine Grenzen. Schwierig werde es, wenn man versuche, Parameter wie Motivation oder die Aufmerksamkeit in ein Modell des Vergessens aufzunehmen. Modelle wie die von Gomez-Rodriguez seien ein klarer Fortschritt, aber sie bildeten nicht alles ab, was das Lernen beeinflusse.

Wie gross der Vorteil des Memorize-Algorithmus im Lernalltag ist, muss nun getestet werden. Gomez-Rodriguez hofft dafür auf eine Zusammenarbeit mit einer Lernplattform wie etwa Duolingo.