Skip to main content

Keyword Density Checker

Analyze word frequency with single words, bigrams and trigrams with density percentages.

Geprüft von · Zuletzt geprüft

0
Total Words
0
Keyword Count
0.00%
Keyword Density

Den Keyword-Dichte-Prüfer verwenden

  1. Füge deinen Entwurfsinhalt in das Textfeld ein. Einfacher Text ist am einfachsten; HTML wird vor dem Zählen von Tags befreit, sodass du einen gerenderten Blogbeitrag direkt aus dem Quelltext einfügen kannst.
  2. Gib optional ein bestimmtes Keyword ein, das du hervorheben möchtest - seine genaue Häufigkeit und Dichte in Prozent erscheinen oben in den Ergebnissen.
  3. Lies die drei Tabellen - Unigramme (Einzelwörter), Bigramme (Zweiwort-Phrasen), Trigramme (Dreiwort-Phrasen). Jede Zeile zeigt die Rohanzahl und die Dichte als Prozentsatz der Gesamtwörter.
  4. Lies das Signal, nicht die Punktzahl - das Ziel ist es, Überoptimierung zu erkennen. Eine Dichte über ca. 3-4 % bei einer einzelnen Phrase ist ein Symptom für unnatürliche Wiederholung; unter 0,5 % für dein Zielthema kann darauf hinweisen, dass die Seite den Begriff tatsächlich nicht abdeckt.
  5. Bearbeite und prüfe erneut - die Zählung wird bei jeder Eingabe aktualisiert, sodass du offensichtliches Stuffing kürzen oder umformulieren und überprüfen kannst, ob die Dichte sinkt.

Wofür dieses Werkzeug ist (und was es nicht ist)

Keyword-Dichte ist eine Diagnose, kein Ziel. Sie ist nützlich als Symptomprüfung: Ein Absatz, der "günstige Zahnimplantate Berlin" siebenmal in 400 Wörtern erwähnt, hat eine Dichte von ca. 5,3 %, die für jeden Redakteur und moderne Suchmaschinen unnatürlich klingt. Das Werkzeug tokenisiert deine Eingabe mit String.prototype.split(/\s+/), wandelt jeden Token in Kleinbuchstaben um, entfernt Interpunktion und erstellt Häufigkeitszählungen für Unigramme, Bigramme und Trigramme mit grundlegender Stoppwort-Filterung. Die Dichteformel ist einfach: (Vorkommen / Gesamttoken) * 100.

Was es dir nicht sagen kann, ist, ob deine Seite ranken wird. Moderne Suchmaschinen haben die Keyword-Dichte-Bewertung um etwa 2013 mit Hummingbird hinter sich gelassen und seitdem BERT (2019), MUM (2021) und Passage-Ranking hinzugefügt - allesamt modellieren sie semantische Absicht statt wörtlicher Phrasenzählungen. Verwende dieses Werkzeug, um Überoptimierung und mangelnde Abdeckung zu erkennen; nutze es nicht, um eine magische Zahl zu erreichen.

Wann du tatsächlich eine Dichtekontrolle durchführen solltest

  • Nachdem du eine Seite veröffentlicht hast, die für die falsche Suchanfrage rankt - oft zeigt der Dichtebericht, dass die Seite stärker über eine sekundäre Phrase handelt als über das primäre Ziel.
  • Beim Bearbeiten eines von mehreren Autoren verfassten Beitrags, um unbeabsichtigte Wiederholungen zu erfassen, bei denen jeder Autor dachte, das Thema "etablieren" zu müssen.
  • Beim Prüfen von Inhalten, die ein SEO-Crawler (Screaming Frog, Sitebulb) als "dünn" markiert hat - Dichte kombiniert mit Wortzahl ergibt ein vollständigeres Bild als jedes allein.
  • Beim Überprüfen von KI-generierten Entwurfsinhalten auf ihre Tendenz, das Prompt-Thema über Absätze hinweg zu wiederholen, was die Unigramm-Dichte weit über natürliche Niveaus aufbläht.
  • Beim Vergleichen deines Entwurfs mit Konkurrenzseiten, die für dieselbe Suchanfrage ranken - nicht um ihre Dichte anzugleichen, sondern um Themenbereiche zu erkennen, die sie abdecken, du aber nicht.

Randfälle, die die Zahl verzerren

  • Stoppwörter blähen Unigramm-Listen auf - "der", "und", "von" dominieren jeden deutschen Text. Das Werkzeug filtert eine Standardliste, aber der Filter ist sprachspezifisch; das Einfügen von Polnischem oder Japanischem erzeugt ungefilterten Lärm.
  • Flektierte Formen zählen getrennt - "Implantat", "Implantate" und "implantiert" sind drei verschiedene Token für das Werkzeug. Ein leichter Stemmer könnte sie zusammenführen, aber Stemming verzerrt andere Statistiken; das Werkzeug lässt Flexion wie sie ist.
  • Markennamen und Produkt-SKUs - werden wie gewöhnliche Wörter gezählt, was die Dichte für Markeninhalte aufblähen kann, bei denen dein Produktname in jedem Abschnitt legitim erscheint.
  • Bindestrich-Komposita - "langfristige Keywords" zählt in manchen Tokenisierern als ein Token und in anderen als drei. Dieses Werkzeug behandelt Bindestriche als interne Wortzeichen, sodass "langfristig" ein einzelnes Unigramm ist.
  • Codeblöcke, URLs und Zitate - werden alle gezählt. Wenn deine Seite ein eingefügtes JSON-Schema oder eine Referenzliste mit DOIs hat, verzerren diese Token die Dichte. Entferne sie vor der Prüfung oder subtrahiere sie gedanklich.
  • Sehr kurze Inhalte - Dichten in Texten unter 300 Wörtern schwanken bei einzelnen Wortbearbeitungen stark, was die Metrik für kurze Texte unzuverlässig macht.

Wie moderne Suchmaschinen Text tatsächlich lesen

Google integrierte BERT im Oktober 2019 in die Suche und erweiterte es im Dezember desselben Jahres weltweit. BERT ist ein transformatorbasiertes Sprachmodell, das die Beziehung zwischen Wörtern in einer Suchanfrage analysiert, anstatt sie als Wortliste abzugleichen. MUM, angekündigt im Mai 2021, fügte sprachübergreifendes und multimodales Verständnis hinzu, und das Passage-Ranking ermöglicht Google, einzelne Abschnitte einer langen Seite zu ranken. Zusammen bedeutet das, dass die Wiederholung eines Keywords in jedem Absatz nicht mehr mit Relevanz korreliert - was zählt, ist, ob der umgebende Inhalt tatsächlich das Konzept diskutiert, das das Keyword repräsentiert.

Alternative Ansätze zur selben Frage

Für "ist meine Seite gut für Suchanfrage X optimiert" ist thematische Abdeckung ein besseres Signal: Diskutiert deine Seite die Entitäten, Unterthemen und verwandten Fragen, die Top-Ranking-Seiten diskutieren? Werkzeuge wie Clearscope, SurferSEO und MarketMuse erstellen Themenmodelle aus SERP-Daten und bewerten Entwürfe daran. Für "ist meine Seite überoptimiert" ist eine Dichtekontrolle tatsächlich hilfreich, aber auch ein menschliches Wiederholungslesen. Für kostenlose Alternativen geben word-freq in Node.js oder Pythons collections.Counter ähnliche Ausgaben. Dieses Werkzeug gewinnt für lokale Analysen ohne Hochladen von Entwürfen zu Drittanbieter-SEO-Diensten.

Häufig gestellte Fragen

Was ist eine "gute" Keyword-Dichte?

Es gibt keine gute Zielzahl. Die pragmatische Interpretation lautet: über ca. 3-4 % für eine einzelne Phrase im Fließtext klingt meist unnatürlich und kann Qualitätskennzeichnungen auslösen; unter 0,5 % für das Zielthema kann bedeuten, dass die Seite den Begriff überhaupt nicht abdeckt. Alles dazwischen ist normal, und der konkrete Wert sagt nichts über die Ranking-Position aus. Optimiere zuerst für Lesbarkeit und thematische Tiefe; prüfe die Dichte anschließend als nachträgliche Plausibilitätskontrolle.

Bestraft Google eine hohe Keyword-Dichte?

Nicht die Dichte als solche, aber Keyword-Stuffing ist in Googles Spam-Richtlinien ausdrücklich als Spam-Verstoß aufgeführt. Stuffing umfasst "Listen von Telefonnummern ohne wesentlichen Mehrwert", "Textblöcke mit Auflistungen von Städten und Regionen" und "Wiederholung derselben Wörter oder Phrasen so oft, dass es unnatürlich klingt". Dichte ist die Art, wie du dieses Symptom misst; die eigentliche Strafe gilt für unnatürliche Inhalte, nicht für die Zahl selbst.

Wofür sind Bigramme und Trigramme nützlich?

Sie erfassen Phrasenhäufigkeiten, die Unigramm-Zählungen übersehen. "Günstig", "Zahnarzt" und "Implantat" könnten einzeln jeweils zu 1,5 % erscheinen - vertretbar - während "günstiges Zahnimplantat" als Bigramm zu 1,2 % erscheint, was für ein zweigliedriges exaktes Match extrem ist. Bigramm- und Trigramm-Tabellen zeigen die spezifischen Phrasen auf, die Suchmaschinen und Leser als erzwungen wahrnehmen, auch wenn kein einzelnes Wort übermäßig erscheint.

Soll ich eine bestimmte Dichte für mein Ziel-Keyword anstreben?

Nein. Das Denkmodell "Dichte X = Ranking Y" ist veraltet. Schreibe die Seite, um das Thema umfassend abzudecken; verwende das primäre Keyword natürlich im Titel, im ersten Absatz und in einer H2; überprüfe dann die Dichte, um sicherzustellen, dass nichts übertrieben ist. Wenn du bei 4 % landest, weil du es erzwungen hast, schreibe es um.

Warum dominieren Stoppwörter die Unigramm-Liste?

Weil englischer Text zu ca. 25-30 % aus Stoppwörtern besteht (allein "the", "a", "of", "and", "to", "in" machen ungefähr 17 % aus). Das Werkzeug filtert eine Standardliste englischer Stoppwörter heraus, bevor es Unigramme rankt, weshalb sie nicht im Ergebnis erscheinen. Für nicht- englische Inhalte fällt der Stoppwort-Filter auf eine generische Liste zurück und lässt möglicherweise einige hochfrequente Funktionswörter in der Ausgabe.

Verarbeitet das Werkzeug HTML?

Ja. Tags werden mit einem einfachen regulären Ausdruck (<code>&lt;[^&gt;]+&gt;</code> durch Leerzeichen ersetzt) entfernt und Leerzeichen vor dem Tokenisieren normalisiert. Das ermöglicht das Einfügen aus "Quelltext anzeigen"-Workflows. Was es nicht tut, ist semantisches Parsen - versteckter Text in <code>style</code>-Attributen oder <code>&lt;noscript&gt;</code>-Blöcken wird gezählt, wenn er vorhanden ist. Füge für saubere Messungen den gerenderten sichtbaren Text statt rohem HTML ein.

Sollten Keyword-Varianten als dasselbe Keyword zählen?

Philosophisch ja, mechanisch nein. "Implantat", "Implantate", "implantiert" und "Implantation" sind morphologische Varianten eines einzigen Konzepts, aber das Zusammenführen durch Stemming erzeugt eigene Verzerrungen - falsche Treffer über nicht verwandte Begriffe, die zufällig denselben Stamm teilen. Dieses Werkzeug lässt flektierte Formen getrennt; du kannst verwandte Zeilen gedanklich addieren, um die wahre Konzeptfrequenz abzuschätzen.

Kann ich die Dichte für mehrere Keywords auf einmal prüfen?

Nicht in einem einzigen Durchlauf mit diesem Werkzeug, aber die Bigramm- und Trigramm-Tabellen decken die häufigsten Mehrwort-Fälle automatisch ab. Für explizite Multi-Keyword-Prüfungen führe das Werkzeug mehrfach aus - jeweils mit einem anderen Keyword im Fokusfeld - oder füge den Text in ein Werkzeug wie SurferSEO oder Clearscope ein, das eine Ziel-Keyword-Liste akzeptiert.

Speichert oder überträgt dieses Werkzeug meine Inhalte?

Nein. Tokenisierung und Zählung finden in einer Preact-Komponente statt, die in deinem Browser läuft. Der Textarea-Wert verlässt nie den clientseitigen Status. Du kannst es über den Netzwerk-Tab in den DevTools überprüfen - tippe, klicke auf Analysieren und beobachte ausgehende Anfragen; es werden keine gemacht. Das ist wichtig für unter Embargo stehende Inhalte, Entwürfe unter NDA und alles, was du nicht preisgeben möchtest.

Was ist mit LSI-Keywords?

"LSI-Keywords" ist ein Begriff, den SEO-Vermarkter lose für "thematisch verwandte Begriffe" verwenden. Google nutzt kein LSI - John Mueller hat dies mehrfach bestätigt. Was moderne Suchmaschinen verwenden, sind semantische Einbettungen (BERT-artige Vektorrepräsentationen), bei denen verwandte Begriffe denselben Vektorraum teilen. Dieses Dichtewerkzeug modelliert keine Einbettungen; es zählt Token.

Ist die Dichte über Sprachen hinweg gleich?

Nein. Agglutinierende Sprachen (Türkisch, Finnisch) packen mehr Bedeutung pro Token, sodass die natürliche Dichte strukturell niedriger ist als im Englischen. Im Zweifelsfall vergleiche mit den bestplatzierten muttersprachlichen Seiten für dieselbe Suchanfrage.

Mehr SEO & Web Tools