Flesch-Kincaid erklärt: Was der Score bedeutet und wie man ihn nutzt
Wie die Flesch Reading Ease und Flesch-Kincaid Grade Level Scores berechnet werden, wofür sie gut sind und welche Grenzen man kennen sollte, bevor man für sie optimiert.
Wenn man einen Entwurf jemals in einen “Lesbarkeits-Checker” eingefügt und eine Zahl erscheinen gesehen hat, war diese Zahl mit großer Wahrscheinlichkeit ein Flesch-Kincaid-Score. Er treibt die Lesbarkeitstatistiken von Microsoft Word, den Hemingway Editor, das Yoast-SEO-Plugin und die meisten Online-”Klassenstufen”-Tools an. Obwohl er alt genug ist, um in jedem Land Alkohol zu trinken, bleibt er die Standardmessung dafür, wie schwer die eigenen Sätze zu lesen sind.
Dieser Artikel schlüsselt auf, was der Score tatsächlich berechnet, warum er sich durchgesetzt hat, in welchen Fällen er die richtige Antwort liefert und in welchen er lügt.
Die Formeln, entmystifiziert
Flesch-Kincaid besteht aus zwei Formeln, nicht einer. Sie teilen eine Eingabe und sind uneinig darüber, was optimiert werden soll.
Flesch Reading Ease bewertet Text auf einer Skala von 0-100, wobei höher leichter bedeutet:
206,835 - 1,015 * (Wörter / Sätze) - 84,6 * (Silben / Wörter)
Ein Score von 100 bedeutet, ein Kind könnte es lesen; ein Score von 30 bedeutet, ein Doktorand würde langsamer werden. Die meisten Populär-Romane landen zwischen 70 und 90. Versicherungsverträge tauchen in einstellige Bereiche ein.
Flesch-Kincaid Grade Level bildet dieselben Eingaben auf eine US-Schulklasse ab:
0,39 * (Wörter / Sätze) + 11,8 * (Silben / Wörter) - 15,59
Ein Score von 8,0 bedeutet, ein durchschnittlicher Achtklassler kann es folgen. Zeitungen zielen auf etwa 7-9. Akademische Arbeiten schweben im Bereich 14-18.
Beide Formeln hängen von zwei Verhältnissen ab: durchschnittliche Satzlänge und durchschnittliche Silben pro Wort. Lange Sätze und lange Wörter machen Scores schlechter. Das ist das gesamte Modell.
Wenn man das eigene Schreiben gleichzeitig gegen beide Formeln bewerten möchte, in den Lesbarkeits-Checker einfügen. Er führt die Berechnung lokal durch und zeigt dieselben Zahlen, die Word zeigen würde, plus einige verwandte Metriken.
Warum genau diese Formel gewonnen hat
Es gibt ein Dutzend anderer Lesbarkeitsformeln (Gunning Fog, SMOG, Coleman-Liau, ARI, Dale-Chall) und die meisten stimmen meistens überein. Flesch-Kincaid hat gewonnen, weil:
- Die US Navy hat sie 1975 für technische Handbücher übernommen. Das gab ihr ein föderales Mandat, das in Bildung und Vertragsrecht überging.
- Sie benötigt nur Silbenzahlen und Satzumbrüche, beides war auf einem Desktop der 1980er Jahre einfach zu berechnen.
- Die Klassenstufen-Ausgabe ist intuitiv. Einem Redakteur zu sagen “Ziele auf Klasse 8” ist eine spezifischere Anweisung als “Score 65 auf einer 0-100-Achse.”
Das Ergebnis ist, dass viele Stilweiterleitungen still Flesch-Kincaid voraussetzen. Das US-Verteidigungsministerium, der IRS und viele staatliche Gesetze zur einfachen Sprache nennen es explizit.
Wie ein guter Score aussieht
Einige grobe Benchmarks, gesammelt aus öffentlichen Korpora:
- Die Bibel (KJV): Klasse 12, Ease 70.
- Reader’s Digest: Klasse 8, Ease 65.
- Time-Magazin: Klasse 11, Ease 52.
- Scientific American: Klasse 13-15, Ease 35-50.
- Ein typisches Software-EULA: Klasse 16+, Ease unter 30.
Für die meisten öffentlich ausgerichteten Texte ist ein Flesch-Kincaid Grade zwischen 7 und 9 ein sicheres Ziel. Unter 6 beginnt sich choppy anzufühlen; über 11 beginnt man allgemeine Leser zu verlieren.
Wenn man für ein technisches Publikum schreibt, höher schieben: Klasse 11-13 ist normal für Engineering-Blog-Posts und kein Problem. Das Problem ist nicht Schwierigkeit, es ist, ob die Schwierigkeit zum Leser passt.
Silben zählen ist schwieriger als es aussieht
Die größte Quelle der Meinungsverschiedenheit zwischen Lesbarkeitswerkzeugen ist, wie sie Silben zählen. Es gibt keinen perfekten Algorithmus für Englisch. Gängige Heuristiken:
- Vokalgruppen zählen, dann ein stummes
eam Ende abziehen. - Aufeinanderfolgende Vokale (
oa,ea,ou) als eine Silbe behandeln. - Ausnahmen für häufige Suffixe hartcodieren (
-ed,-es,-ing).
Selbst mit all dem kann “fire” je nach Dialekt als 1 oder 2 Silben zählen und “really” als 2 oder 3. Die meisten Lesbarkeits-Scorer setzen sich auf eine schnelle Näherung, die um ~3% im Durchschnitt falsch liegt und sich nie mehr Mühe machen, weil das 3%-Rauschen selten die Klassenstufen-Schlussfolgerung ändert.
Das ist der Grund, warum ein einzelner Absatz in verschiedenen Tools leicht unterschiedliche Scores erhalten kann. Die Formel ist identisch; der Silbenzähler ist das, was abweicht.
Wofür der Score gut ist
- Lange Passagen sanity-checken. Wenn ein 600-Wort-Abschnitt bei Klasse 14 herauskommt, stimmt etwas nicht (wahrscheinlich eine Wand langer Sätze) und das Umschreiben wird helfen.
- Zwei Entwürfe vergleichen. Derselbe Autor, dasselbe Thema, unterschiedliche Versionen: eine Verbesserung um 2 Klassen ist real.
- Ein regulatorisches Ziel treffen. Einige US-Bundesstaaten erfordern Verbraucherverträge unter Klasse 8. Einige Bundesbehörden erfordern Plain-Language-Scoring über Ease 60.
- Erwartungen setzen. Ein Blog-Post bei Klasse 12 sagt: “Das ist für ein technisches Publikum.” Allein das ist es wert, dem Redakteur mitzuteilen.
Wofür der Score nicht gut ist
- Verschiedene Autoren vergleichen. Flesch-Kincaid belohnt kurze Sätze und kurze Wörter. Ein erfahrener Autor, der Fachvokabular korrekt verwendet, wirkt “schwieriger” als ein schludriger Autor, der einfache Wörter verwendet, um nichts zu sagen.
- Verschiedene Sprachen vergleichen. Die Konstanten (1,015; 84,6 usw.) wurden für Englisch trainiert. Die Formeln übertragen sich nicht auf Deutsch oder Japanisch in einer sinnvollen Weise.
- Klarheit beurteilen. “Lorem ipsum dolor sit amet” erzielt einen guten Score. Echter Unsinn kann Klasse 6 erreichen, wenn er kurz genug ist.
- Für SEO optimieren. Google hat viele Male gesagt, dass Lesbarkeit eines von vielen Signalen ist. Klasse 8 zu erreichen, wird einen nicht magisch ranken. Klasse 18 zu erreichen, wird einen nicht aus dem Index halten.
Ein praktischer Workflow
Wenn man für ein allgemeines Publikum schreibt und einen vernünftigen Workflow will:
- Normal entwerfen. Nicht über Scores nachdenken.
- Den fertigen Entwurf durch einen Lesbarkeits-Checker laufen lassen.
- Wenn der Grade mehr als 2 über dem Ziel liegt, die längsten Sätze finden und aufteilen. Das ist fast immer der Fix.
- Wenn der Grade stimmt, aber die Prosa leblos wirkt, den Score ignorieren. Die Zahl war ein Werkzeug, kein Urteil.
Für Schritt 2 ist der Lesbarkeits-Checker ein guter Ausgangspunkt, weil er mehrere Scores nebeneinander zeigt. Verschiedene Formeln, die denselben Text unterschiedlich gewichten, ist informativ; wenn Flesch-Kincaid Klasse 12 sagt und SMOG Klasse 8 sagt, nachschauen warum.
Für Schritt 3 kann auch ein Wortzähler nützlich sein, um bestimmte Absätze anzuvisieren, ohne das gesamte Dokument erneut einzufügen.
Eine kurze Geschichte
Das ursprüngliche “Flesch Reading Ease” wurde von Rudolf Flesch 1948 in einem Buch namens The Art of Readable Writing veröffentlicht. Er reagierte auf eine Generation akademischer Prosa, die genuinen unverständlich geworden war. Sein Ziel war einfach: eine einzige Zahl, die einem Redakteur sagen würde, wenn ein Satz zu lang ist.
Die “Kincaid”-Hälfte wurde 1975 von Peter Kincaid hinzugefügt, der am Personnel Research Center der Navy arbeitete. Die Navy musste wissen, ob eingezogene Matrosen ihre Ausbildungshandbücher lesen konnten. Die Klassenstufen-Reformulierung machte den Score umsetzbar: “Ziele auf Klasse 9” war ein Satz, den ein Schreibinstruktor geben konnte.
Diese doppelte Herkunft ist ein Teil des Grundes, warum der Score zwischen lässigen und bürokratischen Verwendungen gespalten wirkt. Er ist gleichermaßen ein Tipp von einem Magazinredakteur von 1948 und eine Navy-Vertragsspezifikation von 1975.
Das Fazit
Flesch-Kincaid ist eine vernünftige günstige Heuristik für “Sind meine Sätze zu lang und meine Wörter zu dicht?” Es ist kein Maßstab für Qualität, Überzeugungskraft oder Korrektheit. Es so wie ein Autor eine Stoppuhr verwenden würde: um eine Ahnung zu bestätigen, nicht um die künstlerische Richtung zu setzen.
Wenn das eigene Schreiben gut bewertet wird und schlecht gelesen wird, hat der Score gelogen. Wenn es schlecht bewertet wird und gut gelesen wird, hat der Score anders gelogen. Der Score ist ein Werkzeug; das Schreiben ist die Sache.
In diesem Artikel erwähnte Tools
- Readability Checker - Free reading level checker and writing grade level analyzer. Flesch-Kincaid, Flesch Reading Ease, Gunning Fog and Coleman-Liau scores in one place.
- Word Counter - Count words, characters, sentences, paragraphs and estimate reading time.
- Character Counter - Count characters with platform-specific limits for Twitter, Instagram and more.