Question 1

Ist das dieselbe Regex-Engine wie in meinem Node.js-Dienst?

Accepted Answer

Wenn deine Node.js-Runtime auf V8 basiert (was bei allen gängigen Node-Builds der Fall ist), dann ja - die Engine ist Irregexp, dieselbe, die diese Seite verwendet, wenn du Chrome benutzt. Safari und Firefox verwenden verschiedene Engines mit nahezu identischer Semantik für gängige Muster, sodass hier getestete Muster auf jede moderne JS-Runtime portierbar sind. Unterschiede zeigen sich an den Rändern: Lookbehind-Unterstützung, Unicode-Property-Escapes und das noch nicht universell verfügbare v-Flag (RegExp v).

Question 2

Warum passt mein Muster in regex101, aber nicht hier?

Accepted Answer

regex101 ist standardmäßig auf PCRE2 (im PCRE2-Tab) eingestellt, das Features unterstützt, die ECMAScript fehlen: possessive Quantifizierer, atomare Gruppen, bedingte Muster, Rekursion und Inline-Modifikatoren wie (?i). Wechsle in regex101 zum ECMAScript/JavaScript-Flavor, um das Verhalten dieses Testers zu reproduzieren. Das Umgekehrte passiert ebenfalls: ECMAScript erfordert das u-Flag für \p{Letter} und ähnliche Property-Escapes, während PCRE sie als immer verfügbar behandelt.

Question 3

Verlässt mein Muster oder meine Testzeichenkette den Browser?

Accepted Answer

Nein. Der RegExp-Konstruktor ist synchron und lebt vollständig in der V8-, SpiderMonkey- oder JavaScriptCore-Engine, die in deinem Browser eingebettet ist. Kein Fetch-Request sendet dein Muster irgendwohin, kein WebSocket ist geöffnet, und es gibt keinen Analytics-Hook, der deinen Testtext empfängt. Du kannst nach dem Laden der Seite das Netzwerk deaktivieren und der Tester funktioniert weiterhin, was der einfachste Weg ist, die lokale Verarbeitung zu beweisen.

Question 4

Wie referenziere ich eine Capture-Gruppe in der Ersetzung?

Accepted Answer

In einer Ersetzungszeichenkette referenziere nummerierte Gruppen mit Dollarzeichen-Nummer, zum Beispiel $1 für die erste Gruppe, $2 für die zweite. Benannte Gruppen verwenden die Form $<name>. Der gesamte Treffer ist $&, der Text vor dem Treffer ist $`, und der Text danach ist $'. In einer Ersetzungsfunktion (String.prototype.replace mit einem Callback) erhältst du Gruppen als positionelle Argumente und das benannte Gruppen-Objekt als letztes Argument.

Question 5

Warum passt .* manchmal zu wenig oder zu viel?

Accepted Answer

Das Punkt-Metazeichen passt standardmäßig nicht auf Zeilenumbrüche. Bei mehrzeiligen Eingaben stoppt es bei jedem 
, was aussehen kann, als ob es zu wenig passt. Füge das s-Flag (dotAll) hinzu, damit . auch Zeilenumbrüche überquert. Umgekehrt ist .* gierig und konsumiert so viel wie möglich, bevor es zurücktrackt; wechsle zu .*? für ein faules Matching, das beim ersten Treffer stoppt. Die Kombination von s mit einem gierigen .* über ein ganzes Dokument ist eine bekannte Leistungsfalle.

Question 6

Was macht das u-Flag tatsächlich?

Accepted Answer

Das Setzen des u-Flags schaltet das Muster in den Unicode-Modus gemäß ECMAScript um. Drei Dinge ändern sich: . passt auf einen Unicode-Code-Punkt statt einer UTF-16-Code-Einheit, sodass Emojis und Zeichen der supplementären Ebene als eines passen; \p{Script=Cyrillic} und ähnliche Property-Escapes werden verfügbar; und Escape-Sequenzen, die keinem definierten Escape entsprechen, werfen einen SyntaxError statt das Literal-Zeichen stillschweigend zu matchen. Für jede moderne internationalisierte Eingabe setze immer u.

Question 7

Kann ich das verwenden, um einen JSON- oder HTML-Parser zu bauen?

Accepted Answer

Du kannst, aber du solltest es nicht. JSON ist kontextfrei (verschachtelte geschweifte Klammern und eckige Klammern) und HTML ist noch komplexer; Regex ist im Chomsky-Sinne eine reguläre Sprache und kann rekursive Strukturen nicht korrekt balancieren. Du bekommst etwas, das auf deiner Stichprobe funktioniert und bei Real-World-Eingaben versagt. Für JSON verwende JSON.parse; für HTML verwende DOMParser oder einen geeigneten Parser wie parse5. Regex ist das richtige Tool zum Scannen flacher Muster innerhalb bereits tokenisierter Eingaben.

Question 8

Wie erkenne ich, ob mein Regex katastrophal zurücktracken wird?

Accepted Answer

Suche nach verschachtelten Quantifizierern, bei denen das innere Muster sich überschneidet, wie (a+)+, (a|a)+ oder (a*)*, gefolgt von etwas, das am Ende scheitern kann. Bei einer langen Eingabe von a-Zeichen, gefolgt von einem nicht-passenden Abschlusszeichen, erkundet die Engine exponentiell viele Möglichkeiten, die a's aufzuteilen. Schreibe mit einem einzigen Quantifizierer um oder verwende atomare Gruppen in Flavors, die sie unterstützen. RE2 und ripgrep vermeiden das Problem völlig, indem sie Backreferences und Lookaround ablehnen.

Question 9

Ist der Sticky-Modus in echtem Code nützlich?

Accepted Answer

Ja, wenn du einen Tokenizer oder Lexer schreibst. Das Setzen des y-Flags lässt den Regex nur am genauen lastIndex passen, sodass du durch eine Zeichenkette einen Token nach dem anderen vorgehen kannst, ohne vorwärts zu suchen. Babel, TypeScript und Prettier verwenden alle Sticky-Modus-Regex in ihren Lexern. Für einmalige Validierung oder Extraktion bleibe bei g oder ohne Flag.

Question 10

Wie schreibe ich einen mehrzeiligen Regex, der noch lesbar ist?

Accepted Answer

ECMAScript hat kein erweitertes x-Flag von PCRE, sodass du keine Kommentare und Leerzeichen innerhalb eines Muster-Literals einbetten kannst. Baue das Muster stattdessen programmgesteuert aus Tagged Templates oder verketteten Zeichenketten und übergib das Ergebnis an new RegExp. Bibliotheken wie XRegExp fügen benannte Gruppen, freies Leerzeichen und Inline-Kommentare auf der nativen Engine hinzu, wenn du sie benötigst.

Regex-Tester

Den Regex-Tester verwenden

Im Inneren

Wann du es verwenden würdest

Häufige Fallstricke und Sonderfälle

Regex-Syntax im Hintergrund

Vergleich mit Alternativen

Häufig gestellte Fragen

Verwandte Tools

Mehr Developer Tools

AI Token Counter

Base64 Encoder & Decoder

Bulk URL Encode / Decode

chmod Calculator

Code Screenshot

Color Converter