Question 1

Welche Zeichen werden standardmäßig kodiert?

Accepted Answer

Die fünf HTML/XML-Sonderzeichen: & wird zu &, < zu <, > zu >, " zu ", und das Apostroph zu '. Das ist die Mindestmenge, die einen String in HTML-Textinhalt oder Attributwerten sicher macht. Alle anderen Zeichen bleiben unverändert, sodass Emoji, Buchstaben mit Akzenten und CJK-Text im Quellcode lesbar bleiben.

Question 2

Was macht die Option "Alle Nicht-ASCII kodieren"?

Accepted Answer

Mit aktiviertem Schalter wird jedes Zeichen mit einem Codepunkt über 127 durch eine dezimale numerische Entity (&#Code;) ersetzt. Die Ausgabe wird reines ASCII, was für Kontexte nützlich ist, die mit UTF-8 unzuverlässig sind - ältere E-Mail-Transporte, manche SMS-Gateways oder Systeme, die standardmäßig ISO-8859-1 verwenden. Der Nachteil ist eine deutlich schlechtere Lesbarkeit; deaktiviere die Option, wenn deine Pipeline durchgehend UTF-8 unterstützt.

Question 3

Kann der Decoder benannte Entities verarbeiten?

Accepted Answer

Ja. Der Decoder akzeptiert jede benannte Zeichenreferenz aus dem HTML Living Standard, das sind über 2.000 Einträge. Häufige wie ©, ®, €, und — werden in ihre Unicode-Äquivalente dekodiert. Der Decoder toleriert auch einige Legacy-Entities, die in alten Browsern ohne abschließendes Semikolon funktionierten, obwohl der Encoder immer die Form mit Semikolon ausgibt.

Question 4

Ist die Verwendung mit nicht vertrauenswürdigen Eingaben sicher?

Accepted Answer

Das Kodieren der fünf Sonderzeichen ist die Grundlage der XSS-Prävention, und dieses Werkzeug implementiert diese Kodierung korrekt. Sichere HTML-Ausgabe erfordert jedoch mehr als Entity-Kodierung: Es muss auch vermieden werden, gefährliche Attribute (javascript:-URLs), Skript-Kontexte und unsichere Verwendungen von Benutzereingaben in Inline-Event-Handlern zu verwenden. Bei der Verarbeitung nicht vertrauenswürdiger Inhalte sollte die Kodierung an der Ausgabegrenze im Web-Framework erfolgen, nicht als Kopier-Einfüge-Schritt.

Question 5

Werden meine Texte an einen Server gesendet?

Accepted Answer

Nein. Der Codec läuft als Preact-Komponente in deinem Browser-Tab und verwendet ausschließlich In-Memory-Zeichenkettenoperationen. Es gibt keinen Fetch-Aufruf, keinen WebSocket und kein Logging. Nutzer testen häufig die Kodierung sensibler Strings (API-Schlüssel, interne URLs, persönliche Daten), und die lokale Verarbeitung ist dabei wichtig; du kannst dies mit den DevTools-Netzwerkdaten bestätigen, die während der Eingabe keine Anfragen anzeigen.

Question 6

Wie werden Unicode-Codepunkte über U+FFFF kodiert?

Accepted Answer

In numerischer Form erscheinen sie als einzelne dezimale oder hexadezimale Referenz - zum Beispiel ist das "Haufen von Kacke"-Emoji 💩 als 💩 in dezimal oder 💩 in hex dargestellt. JavaScript-Strings speichern diese intern als UTF-16-Surrogatpaare, aber der Encoder wandelt Paare in ihren ursprünglichen Codepunkt um, bevor er die Entity ausgibt. Der Decoder macht das Umgekehrte und setzt das Surrogatpaar wieder zusammen.

Question 7

Kann ich die Ausgabe direkt in einem XML-Dokument verwenden?

Accepted Answer

Die Standard-Fünf-Entity-Kodierung entspricht genau dem, was XML 1.0 Abschnitt 4.6 definiert, also ja. Wenn du mit aktivierter Nicht-ASCII- Option kodiert hast, sind numerische Entities ebenfalls gültig in XML. Vermeide benannte Entities jenseits der fünf vordefinierten - ©, und andere sind HTML- spezifisch, und ein XML-Parser ohne DTD wird sie ablehnen.

Question 8

Warum ' statt '?

Accepted Answer

Historische Kompatibilität. Die benannte Entity ' ist gültig in XML 1.0 und HTML5, war aber nicht in HTML 4.01 definiert; ältere Internet-Explorer-Versionen und manche E-Mail-Clients zeigen sie wörtlich statt sie zu dekodieren. Die numerische Form ' funktioniert überall, wo Entities unterstützt werden, daher verwendet der Encoder sie standardmäßig für den Apostroph.

Question 9

Was ist mit doppelt kodierten Texten?

Accepted Answer

Doppelte Kodierung tritt auf, wenn ein Text versehentlich zweimal kodiert wurde - < für <. Ein Decode-Durchlauf ergibt <; ein zweiter ergibt <. Führe Decode wiederholt aus (die Tausch-Schaltfläche hilft beim Verketten von Operationen), bis die Ausgabe sich nicht mehr ändert. Die Grundursache ist meist ein Webformular, das Daten bei der Übermittlung erneut kodiert; behebe die Pipeline, anstatt manuelles Dekodieren zu verwenden.

Question 10

Worin unterscheiden sich HTML-Kodierung und URL-Kodierung?

Accepted Answer

Sie lösen verschiedene Probleme. HTML-Kodierung (dieses Werkzeug) macht Text in HTML-Elementinhalt oder Attributwerten sicher, indem strukturelle Zeichen durch Entities ersetzt werden. URL-Kodierung (Prozent-Kodierung, RFC 3986) macht Text in einer URL sicher, indem reservierte Zeichen durch %XX-Sequenzen ersetzt werden. Ein String in einem Abfrageparameter eines HTML-Links benötigt beides - erst URL-kodiert, um eine gültige URL zu bilden, dann HTML-kodiert, damit die &-Trennzeichen das HTML nicht zerstören. Verwende das URL-Encoder/Decoder-Werkzeug für die andere Richtung.

HTML-Entity-Encoder/Decoder

Den HTML-Entity-Encoder/Decoder verwenden

Was der Codec tut und wie er vorgeht

Wann du dieses Werkzeug brauchst

Fallstricke

Spezifikationshintergrund

Ähnliche Werkzeuge

Häufig gestellte Fragen

Verwandte Tools

Mehr Developer Tools

AI Token Counter

Base64 Encoder & Decoder

Bulk URL Encode / Decode

chmod Calculator

Code Screenshot

Color Converter