Question 1

Erzeugt das Werkzeug echtes UTF-8-Binär oder Unicode-Codepunkt-Binär?

Accepted Answer

Unicode-Codepunkt-Binär, nicht das UTF-8-Übertragungsformat. Der Buchstabe "A" (U+0041) ergibt in beiden Darstellungen 01000001, weil ASCII eine Teilmenge von Unicode ist. Für Zeichen oberhalb von U+007F unterscheiden sie sich: U+00E9 ("e mit Akut") ist in diesem Werkzeug Codepunkt 11101001 (8 Bit), die UTF-8-Bytefolge lautet jedoch 11000011 10101001 (16 Bit). Für byte-genaue Netzwerkprotokoll-Arbeit verwende ein Hex- oder UTF-8-spezifisches Werkzeug; dieses Werkzeug richtet sich an den Lehrfall, der zeigt, wie Zeichen auf numerische Codepunkte im Binärformat abgebildet werden.

Question 2

Wird mein Text gespeichert oder irgendwo gesendet?

Accepted Answer

Nein. Das Werkzeug läuft im Browser mithilfe der JavaScript-String-Methoden und einer einfachen Konvertierungsroutine. Es gibt keinen Fetch-Aufruf, kein WebSocket, kein Analyseereignis mit deinem Text und keine localStorage-Persistenz. Du kannst ein Passwort oder ein privates Dokument in das Eingabefeld eingeben und im DevTools-Netzwerk-Tab beobachten - es werden null Anfragen gesendet. Beim Schließen des Tabs wird der Status gelöscht.

Question 3

Warum unterscheidet sich meine dekodierte Ausgabe von dem, was ich kodiert habe?

Accepted Answer

Nicht übereinstimmende Einstellungen zwischen Kodierung und Dekodierung. Die häufigste Ursache ist der 8-Bit-Auffüllungs-Schalter: Wenn du ohne Auffüllung kodierst, werden ASCII-Zeichen zu 7-Bit-Blöcken (1000001 für A), aber das Dekodieren mit eingeschalteter 8-Bit-Auffüllung teilt den Datenstrom in 8-Bit-Gruppen und erzeugt Datenmüll. Setze Auffüllung und Leerzeichentrennung auf beiden Seiten gleich. Die zweite Ursache ist das Einfügen von Binärcode, der von einem anderen Werkzeug erzeugt wurde, das das UTF-8-Übertragungsformat statt Codepunkte verwendet - die Blockgrenzen stimmen dann nicht überein.

Question 4

Kann ich Binärcode mit zusätzlichen Leerzeichen oder Zeilenumbrüchen dekodieren?

Accepted Answer

Ja. Die Binär-zu-Text-Funktion entfernt mit einem regulären Ausdruck alle Nicht-Ziffern-Whitespace-Zeichen und teilt dann bei Leerzeichen, wenn die Leerzeichentrennung aktiviert ist. Zeilenumbrüche, Tabulatoren und mehrere Leerzeichen zwischen Gruppen werden behandelt. Nicht-binäre Zeichen (Buchstaben, Satzzeichen) werden still verworfen, was praktisch ist, aber Tippfehler verbergen kann - wenn du "10O01" einfügst und eins-null-null-null-eins meinst, bereinigt das Werkzeug es zu "1001", was ein anderer Wert ist.

Question 5

Wie werden Emoji und CJK-Zeichen behandelt?

Accepted Answer

Emoji in der Grundlegenden Mehrzähligen Ebene haben Codepunkte bis U+FFFF; Emoji oberhalb (die meisten modernen Gesichter, Flaggen) gehen bis U+10FFFF und erzeugen bis zu 21 Bit. CJK-Zeichen in der BMP sind 15-16 Bit pro Zeichen. Der Text wird mit [...text] iteriert, was Surrogatpaare beachtet, sodass die Hin-und-Rück-Kodierung alle diese Zeichen beibehält. Für byte-genaue UTF-8-Analyse verwende stattdessen ein Hex-Dump-Werkzeug.

Question 6

Warum wird das Null-Byte beim Dekodieren verworfen?

Accepted Answer

Ein Block aus lauter Nullen repräsentiert Codepunkt 0 (U+0000 NULL), der unsichtbar dargestellt wird und häufig Terminals und HTML beschädigt. Der Dekodierer prüft auf Null und gibt nichts aus, um verwirrende Ausgaben zu vermeiden. Wenn du einen Binärstrom dekodierst, der legitim Null-Bytes enthält (eingebettete Systemdatenblätter, serialisierte C-Strings), verliert dieses Werkzeug sie still; verwende für diese Aufgabe ein hexadezimalorientiertes Werkzeug.

Question 7

Unterstützt dieses Werkzeug Base64 oder Base32?

Accepted Answer

Nein - das sind andere Kodierungen, die von eigenen Werkzeugen auf dieser Seite abgedeckt werden. Base64 (RFC 4648 Abschnitt 4) bildet 3 Bytes auf 4 Zeichen ab, die A-Z, a-z, 0-9, +, / verwenden; Base32 (RFC 4648 Abschnitt 6) bildet 5 Bytes auf 8 Zeichen ab, die A-Z und 2-7 verwenden. Beide sind dichter als rohe Binärdaten. Verwende die Base64- und Base32-Werkzeuge auf dieser Seite dafür; diese Seite ist für die Konvertierung zwischen Text und wörtlichen Binärziffern gedacht.

Question 8

Kann ich Binärcode aus einer CTF-Aufgabe einfügen und die Flagge erhalten?

Accepted Answer

Oft ja. CTF-Flaggenkodierung mit durch Leerzeichen getrennten 8-Bit-Binären ist eine der häufigsten Anfängeraufgaben, und dieses Werkzeug dekodiert sie direkt. Stelle den Modus auf "Binär zu Text", aktiviere 8-Bit-Auffüllung und Leerzeichentrennung je nach Bedarf, füge das Binär ein und lese den dekodierten Text. Wenn die Flagge UTF-8-kodiert ist (Nicht-ASCII-Zeichen), kann die dekodierte Ausgabe kryptisch aussehen, weil das Werkzeug Codepunkte und nicht UTF-8-Bytes dekodiert; versuche in diesem Fall, das Binär in 8-Bit-Gruppen aufzuteilen und einen UTF-8-fähigen Dekodierer zu verwenden.

Binär-zu-Text-Konverter

Konvertierung zwischen rohen Bits und lesbarem Text

Unicode-Codepunkte, UTF-8-Bytes und warum sie sich unterscheiden

Wann du dieses Werkzeug tatsächlich benötigst

Fallstricke beim Hin-und-Rück-Reisen durch Binär

Die breitere Binär-zu-Text-Kodierungslandschaft

Binär vs. Base64, xxd und System-Werkzeuge

Häufig gestellte Fragen

Verwandte Tools

Mehr Text Tools

Case Converter

Character Counter

Emoji Picker & Search

Fancy Text Generator

Find & Replace

HTML to Markdown