Mehr oder weniger intelligente Helfer für reguläre Ausdrücke Die besten Regex-Tools
Anbieter zum Thema
Ohne reguläre Ausdrücke geht es nicht – aber man kann es sich einfach machen! Mit tollen Diensten zum Lernen, Entwickeln und Verifizieren, fertigen Sammlungen und natürlich auch KI-Helferlein.

Reguläre Ausdrücke sind in der Entwicklung omnipräsent. Ob Informationen in großen Textmengen gesucht, Nutzereingaben verifiziert oder Formate umgewandelt werden, immer wieder läuft es auf die kryptischen Ketten aus Sonderzeichen hinaus. Eine recht umfangreiche Einführung in die Thematik findet sich bei uns natürlich auch: Wo sind die Meiers?
So nützlich Regex sind, so sehr können sie auch zu Stolpersteinen werden – für Anfänger wie Profis. Mit dem richtigen Tooling wird es aber einfacher: Im Folgenden haben wir allerlei wirklich durchdachte Helferlein zum Entwickeln, Testen und Erlernen von regulären Ausdrücken zusammengetragen.
RegEx101
Die Seite Regex101.com ist der Klassiker und auch schon die Eierlegende Wollmilchsau. Auf den ersten Blick ist RegEx101 vor allem ein Regex-Editor: Man speist den zu durchforstenden Text ein, schreibt einen regulären Ausdruck und prüft die Matches im Text. Dabei hat man die Wahl zwischen acht verschiedenen Regex-Varianten (Flavors), darf Optionen wie Ungreedy setzen, Delimiter wechseln und die eigentliche Funktion der Regex festlegen, also etwa „Match“ oder „Ersetzen“ – was gleich noch relevant wird.
Die vielleicht wichtigste Funktion im Editor: Alle Teile der Ausdrücke werden farbig markiert und per Tooltip direkt am Mauszeiger sowie auf der rechten Seite ausgiebig erklärt. Auch die On-Mouse-Over-Infos im Quelltext zeigen detailliert, was die Teil-Matches aus Sicht der Regex genau sind. Noch mehr Infos liefert die eingebaute Referenz unten rechts. Damit lassen sich Ausdrücke wunderbar Stück für Stück entwicklen – und natürlich auch überhaupt verstehen! Und wenn noch Verständnislücken bleiben, hilft der Debugger, die Abarbeitung der Regex Schritt für Schritt nachzuvollziehen.
Auf den zweiten Blick ist die Seite aber noch deutlich nützlicher: Unter „Tools“ gibt es etwa die Möglichkeit, für den fertig entwickelten Ausdruck auch direkt nutzbaren Code zu bekommen, unter anderem für C#, Java, JavaScript, PHP, Ruby, Python und erfreulicherweise auch SED. Gerade beim Kommandozeileneditor SED, der aufgrund seiner zeilenweisen Arbeitsweise bisweilen etwas speziell ist, ist das enorm hilfreich.
Statt selbst zu entwickeln, ist es ebenfalls möglich, auf die über 17.000 Community-Ausdrücke zurückgreifen. Zwar sind populäre Regular Expressions wie etwa zur Identifikation von Mail-Adressen meist mehrfach vorhanden -, aber der Editor hilft ja beim Verständnis. Und was gefällt, darf man auch gleich forken und in die eigene Sammlung übernehmen.
RegExr
Auch RegExr ist ein hervorragender Regex-Dienst, allerdings gibt es prinzipiell nur einen Grund, ihn RegEx101 vorzuziehen: Wenn es etwas einfacher sein soll. RegExr hat eine etwas schlankere Oberfläche und verzichtet auf Tools wie Debugger und Code-Generator, erklärt aber immer noch ausreichend und liefert ebenfalls etliche Community-Ausdrücke.
iHateRegex
Hinter dem schönen Titel iHateRegex verbirgt sich eine simple, durchsuchbare Sammlung typischer regulärer Ausdrücke. Funktional kann die Seite mit der Konkurrenz von oben nicht mithalten. Aber iHateRegex setzt auf eine sehr eigenwillige, grafische Aufbereitung der Ausdrücke. Wer gerne visuell lernt, könnte von diesem Ansatz profitieren. Zudem lässt sich das Tool auch recht einfach lokal betreiben und als persönliche Regex-Quelle nutzen.
Regulex
Regulex hat tatsächlich nur einen einzigen Zweck: Reguläre Ausdrücke zu visualisieren. Besonders nützlich ist das etwa für Dokumentationen und Schulungen. Das Ergebnis ist iHateRegex nicht ganz unähnlich, verzichtet aber auf ausschweifende Erklärungen. Zudem lässt sich die Visualisierung als Bild exportieren oder in Webseiten einbetten.
Regex Generator
Der Old-School-Generator von Olaf Neumann überzeugt vor allem mit sehr guter Usability: Man gibt einen Text ein, bekommt daraufhin eine grafische Analyse der einzelnen Bestandteile, kann die relevanten auswählen und schließlich die Regex generieren lassen – inklusive Verwendungsbeispiel für unter anderem C, C#, Java, Kotlin, Python, Ruby und Grep.
Gerade für die ersten Schritte mit regulären Ausdrücken ist der Service wirklich nützlich. Im Gegensatz zu den nun folgenden KI-Hipstern ist er vor allem zuverlässig und zwingt einem kein Debugging auf.
ChatGPT & Co.
Unser Selbstexperiment mit einem Browser hat gezeigt, dass ChatGPT – freundlich ausgedrückt – einigermaßen programmieren kann. Bei regulären Ausdrücken sieht es schon deutlich besser aus: Das Large Language Model ist durchaus dazu in der Lage, komplexe Regexe zu bauen.
Typische Ausdrücke, beispielsweise um eine URL abzugleichen, sind freilich gar kein Problem. Aber auch neue Aufgaben, wie das Finden aller Meier-Schreibweisen ohne Komposita wie Schmidt-Meier oder Mayer-Schmidt, erledigt der Bot ziemlich gut. Die Ausdrücke werden Schritt für Schritt erklärt und auf Wunsch gibt es auch den passenden Code.
Perfekt läuft das aber nicht. Beispielsweise muss man ChatGPT bisweilen darauf hinweisen, dass SED mit erweiterter Regex-Funktionalität wie Lookarounds nichts anfangen kann. Dann gibt es aber brauchbare Workarounds.
Nicht alle Chatbots sind hier gleich gut: You.com beispielsweise bewirbt einen expliziten AI-Regex-Generator. Dieser scheint mittlerweile eingestellt (was der you.com-KI selbst erst mit einem halben Dutzend Nachfrage zu entlocken war), allerdings generiert die normale Suchfunktion auf Anfrage reguläre Ausdrücke.
Die Ergebnisse sind denen von ChatGPT in guten Fällen extrem ähnlich, wenn auch meist ein wenig schwächer. Allerdings sind auch Komplettausfälle zu verzeichnen, die unerwünschten Extra-Code und falsche Regex-Syntax hervorbringen, wie das Bild zeigt.
AI-Regex-Generatoren
Es gibt viele AI-Regex-Generatoren, leider fällt es schwer, hier irgendetwas zu empfehlen.
Regexgo hat einen schönen Ansatz: Einfach Matches und Nicht-Matches eingeben – großartig! Leider meldet das Tool ständig, dass es die Aufgabe nicht erledigen konnte.
AutoRegex will natürliche Sprache verstehen, hat hier aber nur vereinfachte Ausdrücke geliefert oder ist direkt abgestürzt.
Regex.ai punktet ebenfalls mit einem tollen Konzept: Quelltext eingeben, alle Treffer markieren und daraufhin gleich mehrere Varianten anzeigen lassen. Zum Testzeitpunkt gab es leider ausschließlich Fehlermeldungen.
Der Regex-Generator von Codepal.ai versteht ebenfalls natürliche Sprache und liefert in einfachen Fällen auch durchaus korrekte Ergebnisse. Sobald allerdings komplexere Anfragen kommen, sind die Antworten entweder stark vereinfacht oder schlicht falsch. Der Generator ist zwar bisweilen ganz nützlich, hängt aber deutlich hinter ChatGPT hinterher.
Expresso
Zugegeben, Expresso ist schätzungsweise 20 Jahre alt und eine längst nicht mehr betreute Freeware für Windows – und somit eigentlich kaum der Rede wert. Allerdings hat das Tool eine sehr spezielle Herangehensweise. Es gibt eine kleine Bibliothek mit Regexen, Ausdrücke können getestet werden, es gibt Erklärungen und so weiter.
Interessant ist allerdings, dass Teile der Regex über grafische Auswahldialog geändert/konstruiert werden können. Soll sich zum Beispiel ein Treffer darauf beschränken, dass ein bestimmtes Prä- oder Suffix nicht vorhanden ist (etwa foo nur solo, nicht aber als foo-bar oder bar-foo), genügt hier ein Klick. Weder muss man wissen, was ein Negative-Look-behind oder -ahead ist, noch dessen Syntax kennen.
(ID:49756643)