Skip to main content

Word Counter

Count words, characters, sentences, paragraphs and estimate reading time.

Geprüft von · Zuletzt geprüft

0
Words
0
Characters
0
No Spaces
0
Sentences
0
Paragraphs
0m
Reading Time

So wird der Wortzähler verwendet

  1. In den großen Textbereich klicken am oberen Ende der Seite und den Entwurf einfügen oder tippen. Der Bereich vergrößert sich vertikal; die untere rechte Ecke ziehen, wenn mehr Platz benötigt wird.
  2. Die Statistik-Kacheln live aktualisieren beobachten. Unterhalb des Textbereichs befinden sich sechs Kacheln: Wörter, Zeichen, Ohne Leerzeichen, Sätze, Absätze und Lesezeit. Jeder Tastendruck aktualisiert die Zähler in Echtzeit.
  3. Mit einem Ziel vergleichen. Beim Schreiben für ein Tweet-Limit (280), eine Meta-Description (155-160) oder eine 500-Wort-Blog-Einleitung die relevante Kachel beobachten und stoppen, wenn die Marke erreicht ist.
  4. Direkt bearbeiten. Im Gegensatz zu einem Desktop-Editor gibt es keine Speicherschaltfläche; der Text lebt nur im Textbereich und verschwindet beim Schließen des Tabs. Den fertigen Entwurf zurück ins Schreibwerkzeug kopieren wenn fertig.
  5. Den Bereich leeren durch Alles auswählen (Strg+A oder Cmd+A) und Löschen, was jeden Statistikwert auf null zurücksetzt.

Was der Zähler tatsächlich misst

Die Wortzählung teilt den Text bei jeder Folge von Leerzeichen mithilfe des Regex /\\s+/, sodass Wörter alle Nicht-Leerzeichen-Token sind, die zwischen Leerzeichen, Tabs oder Zeilenumbrüchen stehen. Das entspricht Microsoft Word und Google Docs für einfachen lateinischen Prosatext. Die Zeichenzählung liest text.length, was in JavaScript die Anzahl der UTF-16-Code-Einheiten zurückgibt, keine benutzerperziptierten Zeichen; Sätze werden durch Teilen bei .!?-Folgen und Filtern von Leerstellen gezählt; Absätze werden als Blöcke erkannt, die durch Leerzeilen (\\n\\s*\\n) getrennt sind.

Lesezeit verwendet 200 Wörter pro Minute, einen weit zitierten Durchschnittswert für stilles Lesen Erwachsener auf Englisch. Das Ergebnis wird mit Math.ceil aufgerundet, sodass eine 30-Wort-Bildunterschrift 1 Minute statt null meldet. All das läuft innerhalb einer Preact-Komponente im Haupt-Thread des Tabs, ohne Fetch-Aufruf, ohne an den Text gebundenes Analytics-Ping und ohne persistenten Speicher. Der Text verschwindet aus dem Speicher, sobald der Tab geschlossen wird.

Wann und warum man ihn verwenden würde

  • Innerhalb des empfohlenen 1.500-2.500-Wort-Süßpunkts eines Blog-Editors für langformen SEO-Inhalt bleiben.
  • Einen LinkedIn-Beitrag unter die 3.000-Zeichen-Feed-Abschneidegrenze kürzen, um den "Mehr anzeigen"-Klick zu vermeiden.
  • Einen Universitätsaufsatz auf ein striktes 2.000-Wort-Limit bringen, bei dem 10 Prozent drüber oder drunter Punkte kostet.
  • Eine YouTube-Video-Description schreiben, die in das 5.000-Zeichen-Feld passt und dabei die 157-Zeichen-Vorschau trifft.
  • Eine HTML-Meta-Description so abstimmen, dass der Google-Snippet nicht um 155-160 Zeichen abschneidet.
  • Prüfen, dass der erste Post eines Twitter/X-Threads bei 280 Zeichen endet, ohne in einen zweiten Tweet überzulaufen.

Fallstricke mit Unicode, CJK und RTL-Schriften

  • Chinesischer, japanischer und koreanischer (CJK) Text verwendet keine Leerzeichen zwischen Wörtern, sodass der Leerzeichen-Teiler ganze Sätze als ein "Wort" behandelt. Für CJK ist die Zeichenzahl die sinnvolle Metrik; Veröffentlichungsrichtlinien werden üblicherweise in Zeichen, nicht in Wörtern angegeben.
  • Emoji und Astral-Plane-Zeichen wie U+1F600 (grinsendes Gesicht) sind zwei UTF-16-Code-Einheiten, sodass "hallo 😀".length 7 statt 6 meldet. Twitter zählt Emoji aus ähnlichem Grund als zwei Zeichen.
  • Rechts-nach-links-Schriften wie Arabisch und Hebräisch werden korrekt gezählt, weil sie Wörter immer noch mit ASCII-Leerzeichen trennen; der Renderer dreht nur die Anzeigereihenfolge um.
  • Typografische Anführungszeichen und Gedankenstriche zählen als einzelne Zeichen, auch wenn sie aus zwei ASCII-Zeichen auto-konvertiert wurden, sodass die Statistik nach dem Einfügen aus Word sinken kann.
  • Bindestrichwortverbindungen wie "state-of-the-art" zählen als ein Wort, weil kein Leerzeichen die Teile trennt.
  • URLs und Dateipfade zählen ebenfalls als ein Wort, auch wenn sie 80 Zeichen lang sind, was Durchschnittswerte bei technischen Entwürfen verzerren kann.

Wortzählung, Lesegeschwindigkeit und Veröffentlichungskonventionen

Neugierig, wie Leerzeichen, Bindestriche und Kontraktionen intern tokenisiert werden? Weitere Details finden sich unter was als Wort zählt.

"Wortzählung" ist nicht durch eine ISO- oder W3C-Norm geregelt; es handelt sich um eine Veröffentlichungskonvention. Die gängige Definition, verwendet von Word, Docs und Grammarly, sind Nicht-Leerzeichen-Token, getrennt durch Leerzeichen. Akademische Stilguides unterscheiden sich geringfügig: MLA zählt Bindestrichwortverbindungen als ein Wort, Chicago toleriert beides. Leseschnittbenchmarks stammen aus Brysbaerts Meta-Analyse von 2019, die das stille englische Lesen Erwachsener bei etwa 238 wpm für Sachbücher einstuft; wir runden auf 200 als konservative Schätzung, die auch für dichten Text funktioniert. Das Sprechtempo liegt näher bei 130-150 wpm, sodass ein fünfminütiger Lightning Talk rund 700 Wörter anpeilt.

Wissenswerte Alternativen

Word und Google Docs haben eingebaute Zähler (Registerkarte "Überprüfen" in Word, Extras - Wortzahl in Docs), die genauso funktionieren und auch "Seiten" und "Zeilen" in Abhängigkeit von Schrift und Rändern anzeigen. Scrivener und Ulysses fügen Sitzungsziele und Streaks hinzu und eignen sich besser für Romanautoren als ein Browser-Tool für einmalige Verwendung. Der Unix-wc-Befehl ist ideal für Massenberechnung vom Terminal aus. Ein Browser-Tool wie dieses gewinnt, wenn der Text bereits in der Zwischenablage ist und man sich um Social-Media-Zeichengrenzen kümmert, die wc nicht anzeigt.

Häufig gestellte Fragen

Zählen Bindestrichwortverbindungen als ein Wort in Stilguides?

Ja. Das Chicago Manual of Style, AP und MLA zählen eine Bindestrichverbindung (well-being, state-of-the-art) als ein Wort, weil kein Leerzeichen die Teile trennt. Microsoft Word und Google Docs folgen derselben Regel. Die Bindestriche teilen nicht. Bei nicht bindestrichierten offenen Verbindungen (high school) trennt das Leerzeichen wirklich zwei Wörter, sie zählen also als 2.

Zählen Kontraktionen als ein Wort in Stilguides?

Ja, in jedem großen Stilguide. Kontraktionen wie don't, isn't, it's, we'd zählen als ein Wort, weil kein Leerzeichen die Buchstaben trennt. Microsoft Word, Google Docs, Grammarly und akademische Zähler stimmen alle darin überein. Das Apostroph teilt das Wort nicht - auch längere Kontraktionen wie wouldn't've zählen als eines.

Zählt ein Emoji als ein Wort in der Wortzählung?

Nach der Leerzeichen-Trennungskonvention von Microsoft Word, Google Docs und diesem Tool zählt ein von Leerzeichen umgebenes Emoji als ein Wort. Stilguides sprechen Emoji üblicherweise nicht an, weil sie vor Emoji in formellen Texten entstanden. Bei Zeichenzählungen benötigen Emoji typischerweise 2 UTF-16-Code-Einheiten, sodass zeichenbasierte Grenzen (Twitter 280) 2 pro Emoji berechnen.

Zählt Satzzeichen als separate Wörter in der Wortanzahl?

Nein. Standardwortzähler und Stilguides zählen Satzzeichen nicht als Wörter. "Hallo, Welt!" hat 2 Wörter, nicht 4. An ein Wort gebundene Satzzeichen (Kommas, Punkte, Semikolons) trennen es nicht. Einzelne Satzzeichen zwischen Leerzeichen wurden technisch als Token durch die Leerzeichenregel aufgeteilt, aber kein Stilguide behandelt sie als echte Wörter.

Zählt ein Gedankenstrich als separate Wörter in der Wortanzahl?

Es hängt davon ab, ob der Gedankenstrich Leerzeichen hat. Mit Leerzeichen darum trennt der Strich Token, sodass der umgebende Text als separate Wörter zählt. Ohne Leerzeichen behandelt der Leerzeichen-Teiler den verbundenen Text als ein Wort. Die meisten Stilguides empfehlen Leerzeichen um Gedankenstriche für bessere Lesbarkeit.

Stimmt dieser Zähler mit dem in Microsoft Word oder Google Docs überein?

Für einfachen englischen Prosatext mit ASCII-Leerzeichen ja - alle drei verwenden leerzeichen-getrennte Token als Wörter und liefern bei den meisten Entwürfen dieselbe Zahl. Abweichungen gibt es bei Sonderfällen: Word zählt Fußnoten-Markierungen und Überschriften, während manche Online-Zähler das nicht tun, und Docs behandelt aufeinanderfolgende Satzzeichen manchmal anders. Bei typischen 500-5.000-Wort-Entwürfen stimmen die Zählungen bis auf ein oder zwei Token überein.

Wie genau ist die Lesezeitschätzung?

Der Basiswert von 200 Wörtern pro Minute ist absichtlich konservativ. Brysbaert (2019) stellte fest, dass das stille Lesen von Erwachsenen bei Sachbuchtexten durchschnittlich 238 wpm und bei Belletristik 260 beträgt, während akademisches Lesen auf 120-180 wpm sinkt. 200 zu verwenden hält die Schätzung für die meisten Zielgruppen realistisch, ohne dichten Stoff zu unterschätzen. Für "X Min. Lesen"-Badges in Blogbeiträgen kann man runden; für skriptierte Sprache durch 140 teilen.

Warum zeigt eine Zeile chinesischer Zeichen "1 Wort"?

Der Zähler teilt bei Leerzeichen, und wohlgeformter chinesischer, japanischer und koreanischer Text hat keine Leerzeichen zwischen Wörtern. Jedes Zeichen ist selbst ein Morphem, daher zählen chinesische Editoren Zeichen, nicht Wörter. Die Kacheln "Zeichen" und "Ohne Leerzeichen" geben die sinnvolle Zahl für CJK-Text. Das Segmentieren von CJK in "Wörter" erfordert einen wörterbuch-basierten Algorithmus wie Jieba, den ein leichtgewichtiges Browser-Tool nicht mitliefert.

Zählt ein Emoji als ein oder zwei Zeichen?

Die Kachel "Zeichen" verwendet JavaScripts <code>String.length</code>, das UTF-16-Code-Einheiten zurückgibt. Emoji außerhalb der Basic Multilingual Plane - fast jedes moderne Emoji, einschließlich Gesichter, Flaggen und ZWJ-Sequenzen - belegen zwei Code-Einheiten, sodass der Zähler 2 pro Emoji meldet. Eine Länderflagge wie die Frankreichflagge besteht tatsächlich aus zwei Regional-Indikator-Emoji verbunden, zählt also als 4. Twitter gewichtet Emoji ähnlich bei der Durchsetzung seines 280-Limits.

Verlässt mein Text den Browser?

Nein. Der Textarea-Status lebt in einem Preact-<code>useState</code>-Hook im eigenen Tab. Statistiken werden bei jedem Tastendruck aus diesem Status über String-Operationen und Regex abgeleitet. Nichts wird an unsere Server übertragen, und das Tool speichert den Text nicht in localStorage, Cookies oder IndexedDB. Das Schließen des Tabs löscht den Entwurf; Aktualisieren löscht ihn ebenfalls, es sei denn, die Formularwiederherstellung des Browsers greift.

Welche Wortanzahl sollte ein Blogbeitrag, Tweet oder akademischer Aufsatz anstreben?

SEO-Studien (HubSpot, Backlinko, Semrush) legen 1.500-2.500 Wörter für kompetitives Ranking nahe, wobei das Leserengagement näher bei 1.000 seinen Höhepunkt erreicht. Twitter/X begrenzt kostenlose Beiträge auf 280 Zeichen; Instagram-Bildunterschriften erlauben 2.200, bevorzugen aber die ersten 125 vor dem Abschneiden. Akademische Aufsätze folgen dem Rubrum: Ein "Standard"-2.000-Wort-Aufsatz erlaubt meist plus/minus 10 Prozent, und hartbegrenzte Dissertationen schließen Anhänge separat ein. Immer die Vorgabe prüfen; Wortzahl-Konventionen variieren je Verlag.

Ist die Satzzählung für nicht-englischen Text zuverlässig?

Teilweise. Der Detektor teilt bei <code>.!?</code>, was Englisch, Spanisch, Französisch, Deutsch und die meisten lateinschriftlichen Sprachen abdeckt. Er übersieht chinesische und japanische Vollpunkte (ideografisches <code>。</code>), arabische Fragezeichen (<code>؟</code>) und armenische Interpunktion. Abkürzungen mit Punkten wie "Dr." oder "z. B." erhöhen die Zahl ebenfalls. Die Zahl als grobe Orientierung für englische Entwürfe behandeln, nicht als linguistische Analyse.

Warum ändert sich die Zeichenanzahl beim Einfügen aus Word, obwohl der sichtbare Text identisch aussieht?

Word korrigiert gerade Anführungszeichen, Apostrophe und doppelte Bindestriche automatisch in typografische Anführungszeichen und Gedankenstriche. <code>"</code> wird zu <code>"</code>, <code>'</code> wird zu <code>'</code>, <code>--</code> wird zu <code>—</code>. Jedes typografische Zeichen oder jeder Strich ist ein Zeichen, während das Original zwei ASCII-Zeichen gewesen sein konnte. Nicht-trennende Leerzeichen aus Word (<code> </code>) schleichen sich ebenfalls ein und zählen als Zeichen, aber nicht als Leerzeichen-Teiler.

Kann ich Text direkt aus einer PDF einfügen und der Zahl vertrauen?

Meistens, aber auf weiche Bindestriche und gebrochene Zeilentrennungen achten. PDFs fügen oft am Zeilenende einen Bindestrich ein, der als wörtliches Zeichen in die Zwischenablage übergeht, sodass ein getrenntes "inform-ation" als ein langes Wort zählt. Einige PDFs fügen auch mit Ligaturen (fi, fl) als Einzelzeichen statt als zwei ein. Suchen-und- Ersetzen zum Bereinigen ausführen, bevor der Zahl für ein Veröffentlichungsziel vertraut wird.

Schließt der Zähler versteckte Zeichen wie Zero-Width-Joiner ein?

Ja. Zero-Width-Joiner (<code>‍</code>), Zero-Width-Space (<code>​</code>) und Links-nach-rechts-Markierungen (<code>‎</code>) belegen alle Code-Einheiten, erhöhen also die Zeichenzahl, obwohl der Text identisch aussieht. Wenn die Zahl um einige Stellen danebenzu liegen scheint, den Inhalt in ein Hex-Dump- oder Zeichen-Inspektions-Tool einfügen. Übersetzer und Lokalisierer stoßen ständig darauf.

Wie werden Absätze erkannt?

Ein Absatz ist ein Block, der vom nächsten durch mindestens eine Leerzeile getrennt ist - formal zwei aufeinanderfolgende Zeilenumbrüche mit optionalem Leerzeichen dazwischen, abgebildet durch <code>/\n\s*\n/</code>. Harte Zeilenumbrüche innerhalb eines Blocks (Umschalt+Enter in einem Rich-Editor) beginnen keinen neuen Absatz, und Aufzählungslisten, bei denen jedes Element einen Zeilenumbruch hat, kollabieren zu einem einzigen Absatz.

Mehr erfahren

Mehr Text Tools