Suche Menü
Accessibility Experten seit 2003 Universal Design & Barriere­freiheit Ihre Agentur für BITV und BFSG

Was sind Screenreader und wie funktionieren sie?

Kürzlich bin ich wieder mal über einen Beitrag gestolpert, in dem Screenreader als Vorlesefunktion bezeichnet wurden. Die Vorstellung, ein Screenreader würde Webseiten einfach vorlesen scheint gar nicht so selten zu sein, geht aber stark an der Realität vorbei. Ein Screenreader ist eine komplexe Software, die Bildschirminhalte in Sprache oder Brailleschrift übersetzt, um insbesondere Menschen mit einer Sehbeeinträchtigungen die autonome Bedienung von Computern und Smartphones zu ermöglichen.

Der Begriff Screenreader ist dabei eine Sammelbezeichnung für verschiedene am Markt verfügbare Produkte. Im Desktop-Bereich dominieren Programme wie JAWS, NVDA oder VoiceOver (macOS). JAWS ist als kommerzielles Produkt über Jahre gewachsen und bringt eine große Bandbreite an Funktionen, Anpassungsmöglichkeiten und Integrationen mit, insbesondere im Unternehmenskontext. NVDA ist kostenlos und verfolgt als Open-Source-Projekt einen anderen Ansatz: leichter zugänglich, schnell weiterentwickelt, mit starker Community. VoiceOver ist tief in das Apple-Ökosystem integriert und verhält sich entsprechend konsistent über macOS und iOS hinweg.

Auch die integrierte Windows Sprachausgabe (Narrator) gewinnt wieder an Bedeutung. Früher oft als Notlösung belächelt, wird sie durch KI-Stimmen und bessere Web-Unterstützung (besonders in Windows 11) immer öfter als Zweit- oder sogar Primärsystem genutzt. Und auf mobilen Geräten kommt neben VoiceOver unter iOS zusätzlich TalkBack unter Android ins Spiel.

Wer sich stärker mit der Materie auseinandersetzen möchte, dem empfehle ich an dieser Stelle die jährlichen Ergebnisse der großen Screenreader-Nutzer Studie von Webaim.

Diese Unterschiede sind nicht nur technischer Natur. Sie prägen auch, wie Nutzer mit Inhalten umgehen, welche Shortcuts sie verinnerlichen und wie sie sich in digitalen Umgebungen bewegen. Es gibt gemeinsame Prinzipien, aber keine vollständig einheitliche Nutzung.

Wie bedient man Screenreader richtig?

Wer sich intensiver mit digitaler Barrierefreiheit auseinandersetzt, kommt an Screenreadern nicht vorbei. Es ist entscheidend, deren Konzept zu verstehen: Ein Screenreader ist keine bloße Vorlesesoftware, sondern ein mächtiges Interface mit eigener Bedienlogik. Die Grundlage dafür ist der Accessibility Tree – eine semantische Übersetzung der Programmoberfläche. Während dieser im Web aus dem DOM (HTML und ARIA) gespeist wird, generieren native Apps (iOS, Android oder Desktop) ihn aus ihrer jeweiligen View-Hierarchie. In diesem Baum wird festgelegt, welche Rolle ein Element hat, welchen Zustand es besitzt und in welchem Kontext es steht. Diese bereinigte Struktur bestimmt die Ausgabe – völlig unabhängig von der rein visuellen Anordnung auf dem Bildschirm.

Entsprechend dynamisch verläuft die Nutzung: Erfahrene Anwender bewegen sich nicht linear durch Inhalte – sie springen. Der Weg durch eine Anwendung ähnelt eher einer gezielten Abfrage als einem kontinuierlichen Lesen. Überschriften dienen dabei als primäre Einstiegspunkte, während spezielle Listen für Links, Formularfelder oder Buttons wie ein dynamisches Inhaltsverzeichnis funktionieren. Je nach Endgerät ändert sich dabei das Werkzeug, aber nicht die Logik:

  • Am Desktop ist die Tastatur das zentrale Steuerelement. Während die Tab-Taste durch interaktive Elemente führt und Pfeiltasten die schrittweise Navigation übernehmen, ermöglichen unzählige Shortcuts (wie die Taste ‚H‘ für Headings) strukturelle Sprünge. Die Maus bleibt die absolute Ausnahme.
  • Auf mobilen Geräten wird diese Logik in Gesten übersetzt. Statt Tasten nutzen Anwender Wischgesten, um von Element zu Element zu springen, oder den ‚Rotor‘ (iOS) bzw. das ‚Lese-Menü‘ (Android), um die Navigationsebene – etwa von Wörtern auf Überschriften – umzustellen.

Ein oft unterschätzter Aspekt ist die Geschwindigkeit der Sprachausgabe. Viele geübte Nutzer stellen die Synthese deutlich schneller ein als normale Sprechgeschwindigkeit. Für Außenstehende klingt das zunächst wie ein akustisches Rauschen, für den erfahrenen Nutzer bleibt es verständlich. Die Informationsaufnahme wird gerade in der Sprachausgabe stark beschleunigt.

Parallel dazu existieren unterschiedliche Modi. Im sogenannten Lesemodus wird Inhalt erkundet (oft um explorativ Kontext zu gewinnen), im Fokus- oder Formularmodus wird interagiert – etwa beim Ausfüllen von Eingabefeldern. Der Wechsel erfolgt kontextabhängig.

Screenreader-Nutzer sind nicht gleich Screenreader-Nutzer

So wie man Screenreader nicht verallgemeinern und auf Sprachausgabe reduzieren kann, kann man Screenreader-Nutzer nicht als homogene Gruppe betrachten. Die Unterschiede zeigen sich weniger in der verwendeten Software als in der konkreten Arbeitsweise.

Ein klassisches Beispiel sind spät erblindete Menschen mit Restsehfähigkeit, die Vergrößerungssoftware wie ZoomText einsetzen. Der Screenreader läuft hier meist parallel, aber eher unterstützend. Trotz visueller Einschränkung wird immer noch stark visuell gearbeitet: hohe Zoomstufen, invertierte Farben, ein überdimensionierter Mauszeiger. Die Navigation erfolgt trotz starker Sehbehinderung oft über die Maus, unterstützt durch punktuelle Sprachausgabe, zum Beispiel wenn Details unklar sind oder vorgelesen werden sollen. Struktur ist hier ebenso relevant, wird aber anders genutzt – eher als Ergänzung zur visuellen Orientierung.

Am anderen Ende des Spektrums stehen Nutzerinnen und Nutzer, die vollständig ohne visuelle Rückmeldung arbeiten und sich stark auf Tastaturbefehle und Audio verlassen. Hier wird Navigation oft hochgradig effizient: Sprünge zwischen Überschriften, das gezielte Aufrufen von Elementlisten, das schnelle Wechseln von Kontexten. Die Sprachausgabe läuft hier oft in sehr hoher Geschwindigkeit, weil sie nicht zum „Mitlesen“, sondern zum Scannen von Informationen dient.

Es gibt aber auch Szenarien, in denen Sprachausgabe bewusst deaktiviert wird. Etwa im Backoffice oder im Telefonsupport, wo parallele Gespräche geführt werden. Vor allem bei früh erblindeten Menschen kommt in solchen Fällen oft eine Braillezeile zum Einsatz, die Inhalte taktil ausgibt. Die Navigation erfolgt dabei aber weiterhin über die Tastatur.

Zwischen diesen Polen existieren viele Mischformen. Manche Nutzer wechseln situativ zwischen Audio und Braille, andere kombinieren Screenreader mit visuellen Hilfsmitteln, wieder andere nutzen nur einen Teil der verfügbaren Funktionen. Die Bedienlogik bleibt ähnlich, die Gewichtung verschiebt sich.

Diese Vielfalt darf man nicht ausblenden. Schon gar nicht darf man Screenreader auf eine Vorlese-Funktion reduzieren. Die Nutzung eines Screenreaders ist kein passiver Akt, wie Radiohören. Screenreader sind mächtige Bedieninterfaces, deren Möglichkeiten auch mit den Fähigkeiten der Anwender und Anwenderinnen steht und fällt. Das gilt nicht zuletzt auch für Menschen, die Screenreader im Kontext von BITV und BFSG zum Testen verwenden. Wer hier Screenreader nur als Vorlese-Funktion einsetzt und maximal die Tabulatortaste und die Pfeiltasten oder simple Wischgesten zur Bedienung einsetzt, testet am Ende an den verschiedenen Zielgruppen vorbei – und trifft vielleicht sogar falsche Annahmen und Entscheidungen.

Schlagworte:
Digitale Barrierefreiheit
EN 301549