Das inklusive Potenzial auditiven Lesens

Überlegungen zur Aneignung der gesprochenen Schrift von Sprachausgaben

Miklas Schulz

Zusammenfassung
Die fortschreitende Digitalisierung ermöglicht interessante Lesepraktiken, die sich vom klassischen visuellen Lesen unterscheiden. Computergestützte Sprachausgaben, die einst Menschen mit Sehbeeinträchtigungen vorbehalten waren, gehören zunehmend zum Alltag vieler Personen. Der Beitrag untersucht den Status des maschinell gesprochenen Wortes und beschreibt, wie diese gesprochene Schrift angeeignet wird. Auch in der Inklusionspädagogik bieten Screenreader-Programme neue Möglichkeiten. Dieses medientechnische Angebot lässt sich durchaus für eine grössere Zielgruppe im Unterricht nutzen, um eine individuelle und differenzierte Förderung zu ermöglichen.

Résumé
Grâce aux avancées technologiques, des pratiques de lecture intéressantes se développent qui se distinguent de la lecture visuelle classique. Autrefois réservées aux personnes ayant une déficience visuelle, les synthèses vocales assistées par ordinateur font de plus en plus partie du quotidien de nombreuses personnes. Cet article examine le statut du mot parlé par la machine et décrit comment cette écriture parlée est appropriée. Les programmes de lecture d’écran (Screenreader) offrent également de nouvelles possibilités dans le domaine de l'inclusion scolaire. Ce support technologique peut être utilisé dans l’enseignement pour un groupe cible plus large afin de permettre un soutien individuel et différencié.

Keywords: Digitalisierung, Lesen, Leseförderung, inklusiver Unterricht, Hilfsmittel, auditive Wahrnehmung, Sehschädigung / numérisation, lecture, soutien à la lecture, enseignement inclusif, moyen auxiliaire, perception auditive, déficience visuelle

DOI: https://doi.org/10.57161/z2024-06-07

Schweizerische Zeitschrift für Heilpädagogik, Jg. 30, 06/2024

Creative Common BY

Einleitung

Die fortschreitende Digitalisierung legt die Frage nahe, wie Lernprozesse zeitgemäss gestaltet werden können. Beispielsweise werden zunehmend Tablets im Unterricht genutzt, womit Schüler:innen Zugang zu sogenannten Screenreader-Programmen haben. Solche Sprachausgaben verlautlichen hörbar das geschriebene Wort. Sie bieten damit neue Möglichkeiten für eine inklusionsorientierte Förderung medial vermittelter Lerngegenstände. So können sich unterschiedliche Arten des Lesens auf verschiedene Weise verwirklichen. Die unterschiedlichen Lesepraktiken bedienen sich je eigener Medienformate. Sie reichen vom klassischen visuellen Lesen über das haptische Lesen der Brailleschrift bis hin zum Einsatz akustischer Sprachausgaben (Schulz, 2018). Letztgenanntes findet – wie auch im Fall des Verfassers – Anwendung bei Blindheit oder starker Sehbeeinträchtigung.

Die neuen Lesepraktiken bringen Bewegung in festgeglaubte Vorstellungen unserer Schriftkultur. Das von einem Screenreader ausgegebene, gesprochene Wort passt nicht mehr so richtig in die scheinbare Dualität von Stimme und Schrift: Weder lässt sich der akustische Text einer Sprachausgabe als gesprochene Sprache klassifizieren (dafür fehlt die Qualität menschlicher Stimme), noch kann er aufgrund seiner zeitlichen Eigendynamik als Schriftmedium im engeren Sinne gelten. Es wird nun nicht der Zusammenhang zu einem erweiterten Lesebegriff hergestellt, wie er in der Sonderpädagogik verbreitet ist. Stattdessen verdeutlicht der Beitrag, dass bestimmte Hörweisen mit Sprachausgabe als ein Lesen im engeren Sinne beschrieben werden können, weil sie die zentralen Merkmale des visuellen Lesens erfüllen.

Wie ein Lesen mit dem Ohr funktioniert, wurde bereits in verschiedenen Studien untersucht (Schulz, 2020, 2022, 2024). Dabei gibt es mindestens drei Umstände zu berücksichtigen (Schulz, 2024):

Was bedeutet das nun konkret für den Umgang mit Screenreader-Programmen?

Zur Aktualität und Erweiterung der Leseforschung

Die nachweislich schwindenden Lesekompetenzen (McElvany et al., 2023) können als Anlass genommen werden, um noch einmal grundlegend darüber nachzudenken, wie das Lesen funktioniert. Und zwar nicht vornehmlich auf einer kognitiven Ebene, sondern auf einer Ebene der Alltagspraxis.

Visuelles und auditives Lesen

Die Forschung aus den vergangenen Jahren zur Verwendung einer Sprachausgabe verdeutlicht, dass man ihr im schulischen Kontext skeptisch begegnet. Nachdenklich stimmen dabei Vergleiche verschiedener Aneignungsweisen, bei denen das mit Screenreadern hergestellte Hörverstehen im Kontrast zur Brailleschrift nicht überzeugend abschneidet (Winter, 2022). Vor diesem Hintergrund ist mindestens zweierlei naheliegend: Erstens scheint es vielversprechend, sich historisch gewachsener Zusammenhänge bewusst zu werden. Es ist kein neues Phänomen, dass eine auditive Textaneignung insbesondere gegenüber dem visuellen Lesen als defizitär klassifiziert wird. Der Sehsinn verspricht aufgrund seiner Distanziertheit eine der rationalen Erkenntnis geeignete Auseinandersetzung. Dieser Stereotyp konnte sich erfolgreich in die Buchkultur und in ihre Praxis der Schriftentzifferung einschreiben. Andere Sinnesvermögen laden wir hingegen weniger bedeutungsvoll auf. Das gewachsene Misstrauen gegenüber der Stimme kann dadurch erklärt werden, dass der Klang einer Stimme immer schon unwillkürlich (k)ein Träger von Sympathie war. Ihre Qualitäten können zudem als verführerisch gelten (Schulz, 2018). Zweitens sind die Umgangsweisen mit einer Sprachausgabe genauer zu untersuchen und differenziert zu beschreiben. Auf diese Weise kann die Praxis selbst besser verstanden und adäquat gelehrt beziehungsweise zielgerichtet in den Unterricht eingebunden werden.

Maschinensprache

Die Ausgaben des Screenreaders lassen sich als gesprochene Schrift beschreiben (und nicht als gesprochene Sprache), womit die Unterschiede zur menschlichen Rede deutlich werden (Schulz, 2024). Die Schrift ist ein stummes und statisches Medium, das aus sich heraus wenig Bedeutung zu vermitteln vermag. Diese Eigenheiten finden nun über die Technisierung gesprochener Sprache Eingang in dieselbe. Die Sprachausgabe überträgt Qualitäten, die uns aus der Schriftrezeption vertraut sind, auf das maschinell gesprochene Wort. Es braucht den Menschen, um die gesprochene Schrift zum Leben zu erwecken. Wir müssen ihr wesentliche Elemente neu andichten. Lesen heisst folglich, den Sinn eines Textes subjektiv und situativ zu erschaffen. Das passiert bei kompetenten Leser:innen automatisch während der Dekodierung der Schriftzeichen. Die Schriftzeichen werden in (mitunter nur innerlich erklingende) gesprochene Sprache übersetzt, verhelfen ihr damit aber zu einem Sinn, der zuvor in der reduzierten Form der Schriftzeichen lediglich als Potenzial vorgehalten war.

Technische Stimmsynthesen verlautlichen die visuell zu entziffernde Schrift. Man könnte auch von gesprochener Sprache sprechen, wobei ich das aus einer analytischen Perspektive für nicht hinreichend präzise halte. Denn mit der gesprochenen Sprache sind Qualitäten verbunden, die von einer Maschinensprache nicht eingelöst werden. Gemeint sind insbesondere Dimensionen einer bedeutungstragenden Prosodie; die Sprachausgabe kann den Ausdruck des gesprochenen Wortes nicht variieren. Sie kann zwar gemäss ihrer Programmierung eine Betonung simulieren. Dennoch bleibt es bei einer Simulation, weil dahinter kein Subjekt mit Bewusstsein steht. Letzteres bedürfte es allerdings, um in überzeugender Weise von gesprochener Sprache sprechen zu können. Ähnlich verhält es sich im Falle von Lautstärke, Tempo und Rhythmik des akustischen Textes. Manches kann als Einstellungen in der Software vorgenommen werden. Was dann ausgegeben wird, verfügt allerdings immer noch nicht über einen subjektiv gemeinten Sinn. Maschinenstimmen simulieren nicht gemäss eigener Vorstellungen oder Orientierungen und Vorlieben; geschweige denn situativ unterschiedlich und abhängig von ihrer gegenwärtigen Stimmung.

Die Aneignung gesprochener Schrift

Konzept des auditiven Lesens

Bei der Auswertung von Interviews im Rahmen meiner Dissertation ist mir aufgefallen, dass der Screenreader immer nur eine einzelne Lesart über einen Text entfalten kann (Schulz, 2018). An diesem Punkt konnte ich mich selbst beim Einsatz meiner inneren Lesestimme beobachten. Ich habe diese Erkenntnis systematisch weiterverfolgt. Um Interpretationen der Aussagen meiner Interviewpersonen gewinnen zu können, musste ich das von der Sprachausgabe vorgetragene Transkript immer wieder innerlich und in Variationen wiederholen und nachklingen lassen (Schulz, 2022). Aus diesen Beobachtungen entstand das Konzept des auditiven Lesens, das ich nun weiter ausgearbeitet habe (Schulz, 2024). Um das Konzept zu überprüfen, habe ich andere Menschen zu ihren Umgangsweisen mit dem Screenreader befragt.

Dass ein Screenreader nur gesprochene Schrift ausgibt und keine gesprochene Sprache im engeren Sinne, hat bedeutende Folgen für die Rezeption. Der dabei vielleicht strittigste Punkt ist der Einsatz der inneren Lesestimme, die auch beim auditiven Lesen mitliest (Jäger, 2014). Nach einer bekannten Definition des Literaturwissenschaftlers Klaus Weimar (1999) heisst Lesen, in fremdem Namen zu sich selbst zu sprechen. Der fremde Name, in dem zu sich selbst gesprochen wird, ist die Aussage des Autors oder der Autorin. In dieser Perspektive trägt man sich die entzifferte Aussage selbst vor. Das geschieht meist innerlich und leise. Wird nun laut gelesen, verbalisiert die Lesestimme die Gedanken des Autors oder der Autorin für sich und andere hörbar.

Im Vergleich zur stimmlichen Rede fehlen der gesprochenen Schrift, wie bei der Schrift üblich, bestimmte Qualitäten. Um einen Text tiefgreifend verstehen zu können, sind diese Qualitäten, wie zum Beispiel eine sinntragende Betonung, jedoch unabdingbar. Diese Aspekte gesprochener Sprache müssen der maschinell gesprochenen Schrift nun wieder angedichtet werden. Anderenfalls entsteht keine Aneignungspraxis, die die Bezeichnung als Lesen verdienen würde (Jäger, 2014).

Soll also auditiv gelesen werden, muss die eigene Lesestimme das von der Sprachausgabe Verlautlichte noch einmal wiederholen. Folglich ist beim auditiven Lesen ein Nachsprechen der gesprochenen Schrift geboten. Dafür ist eine kontrollierte Textausgabe erforderlich, die als Zeitregie bezeichnet werden kann. Über eine solche Zeitregie können die eigene Lesestimme und die fremde Stimme der Sprachausgabe miteinander in einen Dialog gebracht werden – ähnlich wie es beim Dolmetschen der Fall ist. Wichtig ist dabei jedoch eine kleine zeitliche Lücke. Sie gewährleistet, dass sich die Lesestimme erfolgreich in den auditiven Leseprozess integrieren lässt. Somit laufen die individuelle Lesestimme und die technische Stimmsynthese zuweilen parallel. Es besteht die Gefahr, dass die eigene, die gesprochene Schrift nachsprechende Lesestimme, von der Maschinenstimme übertönt wird. Kein Mensch kann mit seiner eigenen Lesestimme Schritt halten, wenn ein Screenreader begonnen hat, ein ganzes Buch vorzutragen. Daher ist die individuelle Kontrolle der Textausgabe wesentlich. Sie muss gemäss der Komplexität des Inhalts und der Lesesituation entsprechend angepasst werden. Das gilt sowohl für die Sprechgeschwindigkeit der Sprachausgabe als auch für die zu beachtenden kurzen Lücken. Erst sie laden nämlich zu den Denkpausen ein, die für ein umfassendes Textverständnis so wichtig sind.

Texthören und auditives Lesen in der Schule

Es ist bedeutsam, den Schüler:innen einen differenzierten Umgang mit einer Sprachausgabe beizubringen und insbesondere den Unterschied zwischen Texthören und auditivem Lesen zu berücksichtigen. Es reicht nicht aus, ihnen allein die Alternative des Screenreaders anzubieten, ohne jedoch auf die Qualität der gesprochenen Schrift einzugehen und ohne gezielt Hörweisen zu trainieren. Es muss eine Sensibilität geschaffen werden für die Geschwindigkeit der Ausgabe und die Lücken als Pausen zum Nachsprechen und Nachsinnen. Die Schüler:innen müssen eine bewusste Entscheidung treffen, wann welche der beiden Hörweisen dem Text und der Lesesituation angemessen ist. Wenn Passagen oder Sätze unverstanden bleiben, müssen sie wiederholt werden. Schliesslich ist das Ziel ein umfassendes Textverständnis und nicht, die Lektüre möglichst schnell zu beenden.

Fazit und Ausblick

Bei der individuellen Förderung durch den Einsatz einer Sprachausgabe liesse sich durchaus an eine heterogene Gruppe insgesamt leseschwächerer Schüler:innen denken; insbesondere, wenn Herausforderungen bei der Leseflüssigkeit vorliegen. Hierbei unterstützt der automatisch fortlaufende akustische Text erheblich. Zu vermuten ist, dass nicht nur in Förderschwerpunkten wie Lernen, Sprache oder in migrationsbedingten DAF/DAZ-Zusammenhängen (Deutsch als Fremdsprache [DAF], Deutsch als Zweitsprache [DAZ]) eine Entlastung durch alternative Aneignungsoptionen willkommen wäre. Für eine zunehmende Zahl von Schüler:innen würde es möglich, einen Text mithilfe des Ohres und dem eingeübten Zuhören gut zu verstehen, ohne ihn selbst entziffern zu müssen. Akustische Angebote durch die gesprochene Schrift lassen sich in verschiedenen Unterrichtsfächern und immer dann als Förderung einsetzen, wenn Text gelesen, verstanden und mit seinem Inhalt gearbeitet werden soll. Es bedarf lediglich einer digitalen Version dieses Textes (z. B. einer Aufgabenstellung oder Kurzgeschichte), die daraufhin mit einem entsprechenden Endgerät (Tablet oder PC) individuell gehört oder auditiv gelesen werden kann. Die Möglichkeiten, die das Ohr mithilfe medientechnischer Unterstützung für ein Lesen zu bieten hat, sind bisher in weiten Teilen verkannt geblieben. Diese Unterschätzung scheint kein Zufall zu sein, hängt sie doch mit einem bislang nicht hinreichend präzisen Verständnis der Ausgaben von Screenreadern zusammen, die die eigentliche Dekodierung der Schriftzeichen nicht vollumfänglich übernehmen können. Insofern dieser Umstand Berücksichtigung findet, vermögen alternative Textaneignungsstrategien einen Beitrag zur Verwirklichung von Bildungschancen zu leisten.

Wie erläutert, gibt es drei wesentliche Dimensionen, die beim Gelingen des auditiven Lesens zu berücksichtigen sind:

Natürlich existiert weiterhin die Wahl, ob diese Bedingungen eingelöst werden oder nicht. Ein akustischer Text, der von einem Screenreader ausgegeben wird, kann auch weiterhin schlicht gehört statt gelesen werden. Ersteres etabliert keine so rigide Zeitregie. Die innere Lesestimme bleibt somit ausgeblendet. Dadurch erfolgt auch kein innerliches Nachklingen der Wörter, die das gerade Gehörte wiederholen könnten. Die gesprochene Schrift wird dann nicht in identischer Weise interpretiert, wie das beim visuellen Lesen der Fall ist. Damit existiert tatsächlich ein erheblicher Unterschied zu Praktiken des Texthörens, womit vermutlich auch das geringere Hörverstehen in der blindenpädagogischen Forschung erklärbar sein dürfte – vermessen wurde hier nämlich kein auditives Lesen (Winter, 2022).

Aus einer inklusionspädagogischen Perspektive scheint es naheliegend, dass nicht nur Menschen mit Sehbeeinträchtigungen von einer solchen Hilfstechnologie profitieren können. Die Forschung zeigt seit Längerem gute Erfahrungen mit dem Hörbuch im inklusiven Deutschunterricht und mit dem auditiven Textverstehen (Gailberger, 2011; Müller, 2021). Zusätzlich verfügt die Sprachausgabe über eine Reihe von Vorteilen, zum Beispiel (Schulz, 2024):

Abschliessend ist es wenig verwunderlich, dass auch der Hörsinn für seine Lesefähigkeit spezifische Bedingungen mit sich bringt; beim visuellen Lesen ist es schliesslich auch nicht anders. Funktioniert letztere Praxis nicht im Dunkeln, ist beim Lesen mit dem Ohr die Zeitebene (Sprechgeschwindigkeit und Steuerung des Textflusses) massgebend.

Prof. Dr. phil. Miklas Schulz

Gastwissenschaftler im Bereich

Inklusive Pädagogik und Schulentwicklung

Abt. Angewandte Erziehungswissenschaft

Stiftung Universität Hildesheim

schulzm@uni-hildesheim.de

Literatur

Gailberger, S. (2011). Lesen durch Hören. Leseförderung in der Sek I mit Hörbüchern und neuen Lesestrategien. Beltz.

Jäger, L. (2014). Audioliteralität. Eine Skizze zur Transkriptivität des Hörbuchs. In N. Binczek & C. Epping-Jäger (Hrsg.), Das Hörbuch. Praktiken audioliteralen Schreibens und Verstehens (S. 231–253). Fink.

McElvany, N., Lorenz, R., Frey, A., Goldhammer, F., Schilcher, A. & Stubbe, T. (2023). IGLU 2021. Lesekompetenz von Grundschulkindern im internationalen Vergleich und im Trend über 20 Jahre. Waxmann.

Müller, K. (2021). Zum Potenzial digitaler Hörmedien im inklusiven Literaturunterricht. Medien im Deutschunterricht, 3 (1), 1–12. https://doi.org/10.18716/OJS/MIDU/2021.1.6

Schulz, M. (2018). Hören als Praxis. Sinnliche Wahrnehmungsweisen technisch (re-)produzierter Sprache. Springer VS.

Schulz, M. (2020). Fordern ohne Fördern. Das auditive Lesen als Erweiterung einer inklusiven Hördidaktik. In M.  Grosche, J. Decristan, K. Urton, G. Bruns, B. Ehl & N. Jansen (Hrsg.), Sonderpädagogik und Bildungsforschung – Fremde Schwestern? (S. 86–90). Klinkhardt.

Schulz, M. (2022). Lesen und Hören von Texten. Das Verhältnis von Lektürepraktiken, Sprachausgabe und Sinneswahrnehmung aus Perspektive der Critical Blindness Studies. blind-sehbehindert, 142 (1), 19–32.

Schulz, M. (2024). Auditives Lesen. Hörweisen mit Sprachausgabe – konzeptionelle Überlegungen und empirische Befunde. Beltz Juventa.

Weimar, K. (1999). Lesen. Zu sich selbst sprechen in fremdem Namen. In H. Bosse & U. Renner (Hrsg.), Literaturwissenschaft. Einführung in ein Sprachspiel (S. 49–62). Rombach.

Winter, F. (2022). Duale Schriftnutzung. Brailleschrift und Schwarzschrift. Eine sequenzielle, explanative Mixed-Methods Studie. Springer VS.