Question 1

Folgt der Parser RFC 4180?

Accepted Answer

Ja, mit sinnvollen Erweiterungen für die Praxis. Anführungszeichen, doppelte Anführungszeichen innerhalb von zitierten Feldern und eingebettete Zeilenumbrüche innerhalb von zitierten Feldern verhalten sich alle gemäß der Spezifikation. Die Erweiterungen umfassen die automatische Erkennung von Tabulator-, Semikolon- und Pipe-Trennzeichen (die RFC schreibt nur Komma vor), Toleranz gegenüber sowohl \n als auch \r\n-Zeilenenden (die RFC schreibt CRLF vor) und die Behandlung kurzer Zeilen als mit nachlaufenden leeren Spalten statt einem Fehler.

Question 2

Warum sind numerisch aussehende Zellen im JSON noch Zeichenfolgen?

Accepted Answer

Weil CSV keine Typen hat. Eine Zelle wie 01234 könnte eine führende Null-Ganzzahl, eine Postleitzahl oder ein Telefonvorwahl sein - und sie in eine JavaScript-Zahl zu casten würde die führende Null stumm entfernen. Statt zu raten, lässt der Konverter jede Zelle als Zeichenfolge; du kannst spezifische Spalten selbst mit einem einzeiligen map in JavaScript casten, wenn du weißt, welche tatsächlich numerisch sind.

Question 3

Wie werden zitierte Felder mit Kommas darin behandelt?

Accepted Answer

Korrekt. Die Zustandsmaschine wechselt in den "innerhalb zitierten Felds"- Modus, wenn sie ein öffnendes Anführungszeichen findet, und verlässt diesen Modus nur, wenn sie ein schließendes Anführungszeichen sieht, auf das kein weiteres Anführungszeichen folgt (doppelte Anführungszeichen bedeuten ein wörtliches Anführungszeichen). In diesem Modus werden Trennzeichen und Zeilenumbrüche als Inhalt statt als Strukturmarker behandelt. Nicht geschlossene Anführungszeichen verbreiten den Modus bis zum Ende der Eingabe, was meist als ein riesiges Feld in der Ausgabe sichtbar ist.

Question 4

Kann ich tabulatorgetrennte Werte (TSV) konvertieren?

Accepted Answer

Ja. Die automatische Erkennung erkennt Tabulatoren, indem sie auf der ersten Zeile zählt - wenn Tabulatoren Kommas überwiegen, wird die Datei als TSV geparst. Du kannst auch in der Trennzeichen-Dropdown-Liste explizit Tabulator wählen, um es zu erzwingen. TSV ist generell ein sichereres Format als kommagetrennt, weil Tabulator-Zeichen fast nie in Datenfeldern vorkommen; wenn du das Format an der Quelle wählen kannst, bevorzuge TSV.

Question 5

Werden meine Tabellenkalkulationsdaten an einen Server gesendet?

Accepted Answer

Nein. Der Konverter ist Preact-Code, der mit dem Seiten-Bundle geliefert wird und in deinem Browser-Tab läuft. Auf Konvertieren zu klicken ruft eine lokale Parser-Funktion auf; es gibt keine fetch-Anfrage, keine Speicherung in localStorage und keinen Hintergrund-Service-Worker, der deine Daten verarbeitet. Das ist wichtig, weil CSV-Exporte häufig personenbezogene Daten enthalten - Kundennamen, E-Mail-Adressen, Kontonummern - und dieses Werkzeug nie einen Server sieht.

Question 6

Was passiert mit leeren Zeilen?

Accepted Answer

Vollständig leere Zeilen (entweder eine Leerzeile oder eine Zeile mit nur Trennzeichen) werden übersprungen statt ein Objekt mit leeren Zeichenfolge- Werten für jedes Feld zu erzeugen. Das vermeidet das Verschmutzen der Ausgabe mit Geister-Datensätzen, die reale CSVs manchmal zwischen tatsächlichen Datenzeilen ansammeln. Wenn du diese als explizite Datensätze benötigst, kannst du dich an deinen eigenen Zeilengrenzen aufteilen, bevor du einfügst.

Question 7

Wie groß eine Datei kann ich einfügen?

Accepted Answer

Die Zwischenablage des Browsers kann Dutzende von Megabytes handhaben, und der Parser ist linear in der Eingabegröße. In der Praxis werden Dateien bis zu etwa fünf Megabytes in wenigen Sekunden auf einem typischen Laptop konvertiert. Größere Dateien frieren den Tab vorübergehend ein, weil das Parsen auf dem Hauptthread läuft. Für multi-gigabyte Dateien verwende xsv oder csvkit auf der Kommandozeile, wo Streaming-Parser das Laden des gesamten Dokuments in den Speicher vermeiden.

Question 8

Werden doppelte Spaltennamen die Ausgabe verwirren?

Accepted Answer

Ja. JSON-Objekte können keine doppelten Schlüssel haben, sodass wenn dein Header zwei Spalten mit dem Namen email hat, nur die letzte pro Zeile gewinnt. Der Parser benennt sie nicht um. Wenn deine CSV tatsächlich Duplikate hat, schreibe den Header um (email_privat, email_arbeit), bevor du konvertierst. Werkzeuge wie csvkit melden Duplikate beim Laden als Warnungen.

Question 9

Unterstützt es CSV-Dateien mit einer BOM?

Accepted Answer

Teilweise. Eine UTF-8-BOM am Anfang der Datei erscheint als unsichtbares Zeichen in der ersten Header-Zelle. Wenn nachgelagerter Code nach einem bestimmten Header-Namen sucht, schlägt die Übereinstimmung möglicherweise fehl. Die sauberste Lösung ist, ohne BOM aus Excel zu speichern oder sed -i '1s/^\xef\xbb\xbf//' file.csv vor dem Einfügen zu verwenden. Manche Browser entfernen die BOM beim Einfügen aus der Zwischenablage, sodass das Problem intermittierend ist.

Question 10

Wie werden verschachtelte Strukturen dargestellt?

Accepted Answer

CSV ist flach. Der Konverter erzeugt ein Array flacher Objekte mit Zeichenfolge-Werten - es gibt keine Möglichkeit, "diese Zelle ist tatsächlich ein JSON-Objekt" innerhalb von CSV selbst auszudrücken. Wenn deine Daten verschachtelte Felder haben, kodiere sie als JSON-Zeichenfolgen innerhalb einer Zelle (der Konverter lässt sie als Zeichenfolgen) oder wähle ein reichhaltigeres Austauschformat wie zeilengetrenntes JSON.

CSV-zu-JSON-Konverter

Den CSV-zu-JSON-Konverter verwenden

Was der Parser tut

Aufgaben, für die dieses Werkzeug passt

CSV-Macken und Fallstricke

RFC 4180 in der Praxis

Alternative Ansätze

Häufig gestellte Fragen

Verwandte Tools

Mehr Developer Tools

AI Token Counter

Base64 Encoder & Decoder

Bulk URL Encode / Decode

chmod Calculator

Code Screenshot

Color Converter