Diese Übersetzung ist unvollständig. Bitte helfen Sie, diesen Artikel aus dem Englischen zu übersetzen.
Erschafft ein reguläres Ausdrucksobjekt für musterbasierten Textvergleich.
Für eine Einführung darüber, was reguläre Ausdrücke sind, lesen Sie das Kapitel Regular Expressions im JavaScript Guide (englisch).
Syntax
/muster/flagsRegExp(muster [, flags])
Parameter
muster- Text des regulären Ausdrucks.
flags-
Optional, flags kann eine Zeichenkette mit einer beliebige Kombination folgender Werte sein:
g- globale Suche (nach einem Treffer fortsetzen)
i- Groß-/Kleinschreibung ignorieren
m- multiline; behandelt den Suchkontext als Mehrfachzeilen, d.h. Anfang- und Endeanker (^ und $) entsprechen dem Anfang bzw. Ende jeder einzelnen Zeile (begrenzt durch \n oder \r), nicht nur dem Anfang und Ende der gesamten zu durchsuchenden Zeichenkette.
y- sticky; matches only from the index indicated by the
lastIndexproperty of this regular expression in the target string (and does not attempt to match from any later indexes). This allows the match-only-at-start capabilities of the character "^" to effectively be used at any location in a string by changing the value of thelastIndexproperty.
Beschreibung
Es bestehen zwei Möglichkeiten, ein RegExp-Objekt zu erzeugen: Eine literale Notation und ein Konstruktor. In der literaren Version werden im Gegensatz zu der Konstruktorversion keine Anführungszeichen verwendet, um Zeichenketten zu kennzeichnen. Dementsprechend erzeugen beide der folgenden Zeilen den gleichen regulären Ausdruck:
/ab+c/i;
new RegExp("ab+c", "i");
Die literale Notation stellt eine Kompilierung des regulären Ausdrucks während der Auswertung des Ausdrucks bereit. Nutzen Sie die literale Notation, wenn der reguläre Ausdruck unverändert bleiben wird. Wenn Sie zum Beispiel die literale Notation für die Erzeugung eines regulären Ausdruck verwenden, um ihn in einer Schleife zu anzuwenden, wird der reguläre Ausdruck nicht in jedem Schleifendurchlauf rekompiliert.
Der Konstruktor des RegExp-Objekt, z.B. new RegExp("ab+c"), stellt eine Laufzeitkompilierung des regulären Ausdrucks bereit. Nutzen Sie die Konstruktor-Funktion, wenn sich das reguläre Suchmuster ändern wird oder Sie das Muster nicht kennen und es aus einer anderen Quelle wie z.B. einer Benutzereingabe beziehen.
Bei Verwendung der Konstruktor-Funktion sind die normalen Zeichenfolgenmaskierungsregeln (voranstellen eines Rückwärtsschrägstrichs (\) vor Sonderzeichen innerhalb von Zeichenketten) einzuhalten. Zum Beispiel sind folgende Zeilen äquivalent:
var re = /\w+/;
var re = new RegExp("\\w+");
Bedeutung spezieller Zeichen in regulären Ausdrücken
| Zeichenklassen | |
|---|---|
| Zeichen | Bedeutung |
. |
(Punkt, Satzendezeichen) stimmt mit jedem Einzelzeichen außer den Zeilenvorschub- und Wagenrücklaufzeichen ( Zu beachten ist, daß das
|
\d |
Stimmt mit einer arabischen Ziffer überein. Äquivalent zu
|
\D |
Stimmt mit jedem Zeichen überein, das keine arabische Ziffer ist. Äquivalent zu
|
\w |
Stimmt mit einem alphanumerischen Zeichen (Wortzeichen) einschließlich dem Unterstrich überein. Äquivalent zu
|
\W |
Stimmt mit jedem Zeichen überein, das kein alphanumerisches Zeichen (Wortzeichen) ist. Äquivalent zu
|
\s |
Stimmt mit einem einzelnen Leerraumzeichen überein (Leerzeichen, Tabulator, Seitenvorschub, Zeilenvorschub und weitere Unicode-Zeichen). Äquivalent zu
|
\S |
Stimmt mit einem einzelnen Zeichen überein, das kein Leerraumzeichen ist. (Nicht-Leerraumzeichen).
|
\t |
Stimmt mit einem Tabulatorzeichen überein. |
\r |
Stimmt mit einem Wagenrücklaufzeichen überein. |
\n |
Stimmt mit einem Zeilenvorschub überein. |
\v |
Stimmt mit einem vertikalen Tabulatorzeichen überein. |
\f |
Stimmt mit einem Seitenvorschub überein. |
[\b] |
Stimmt mit einem Rücklöschzeichen (Backspace) überein. (Nicht zuverwechseln mit |
\0 |
Stimmt mit einem NUL-Zeichen überein. (Keine weiteren Ziffern dürfen folgen!) |
\cX |
Wobei
|
\xhh |
Stimmt mit einem Zeichen mit dem Code /foo\x20bar/ passt z.B. auf 'o b' in "foo bar". |
\uhhhh |
Stimmt mit einem Zeichen mit dem Unicode hhhh (vier hexadezimale Ziffern) überein. |
\ |
Bei einem Zeichen, das normalerweise als Literal behandelt wird, signalisiert ein vorangestellter Rückschrägstrich, daß es als Spezialzeichen und nicht als Literal zu interpretieren ist. Z.B. passt oder Bei einem Zeichen, das normalerweise als Zeichen mit spezieller Bedeutung interpretiert wird, signalisiert ein vorangestellter Rückschrägstrich, daß es ohne besondere Bedeutung als Literal interpretiert werden soll. Zum Beispiel ist * Quantor-Spezialzeichen, das eine Übereinstimmung mit null oder mehreren Vorkommen des vorausgehenden Zeichens bedeutet; z.B. bedeutet |
| Zeichen | Bedeutung |
[xyz] |
Zeichenauswahl, stimmt mit einem beliegen der eingeschlossenen Zeichen überein. Mittels eines Bindestriches kann ein Bereich von Zeichen angegeben werden.
|
[^xyz] |
Eine negative bzw. komplementäre Zeichenauswahl. Das bedeutet eine Übereinstimmung mit jedem Zeichen, das nicht in den eckigen Klammern eingeschlossen ist. Mittels eines Bindestriches kann ein Bereich von Zeichen angegeben werden. Zum Beispiel ist |
| Bereichsgrenzen | |
| Zeichen | Bedeutung |
^ |
Stimmt mit dem Anfang eines Subjekts und, wenn das multiline flag gesetzt ist, auch mit der Stelle unmittelbar nach einem Zeilenumbruchzeichen überein.
|
$ |
Stimmt mit dem Ende eines Subjekts und, wenn das multiline flag gesetzt ist, auch mit der Stelle unmittelbar vor einem Zeilenumbruchzeichen überein.
|
\b |
Stimmt mit einer null-breiten Wortgrenze wie zwischen einem Buchstaben und einem Leerzeichen überein. (Nicht zu verwechseln mit der Zeichenklasse
|
\B |
Stimmt mit einer null-breiten Nichtwortgrenze wie zwischen zwei Buchstaben oder zwischen zwei Leerzeichen überein.
|
| Gruppierung und Rückwärtsreferenz | |
| Zeichen | Bedeutung |
(x) |
Stimmt mit
Aufzeichnende Gruppierungen führen zu Performanzeinbußen. Wenn die übereinstimmenden Teilzeichenketten nicht wiederverwendet werden müssen, sind nicht aufzeichnende Klammern zu bevorzugen (siehe weiter unten). |
\n |
Wobei
|
(?:x) |
Matches x but does not remember the match. These are called non-capturing parentheses. The matched substring can not be recalled from the resulting array's elements [1], ..., [n] or from the predefined RegExp object's properties $1, ..., $9. |
| Quantoren | |
| Zeichen | Bedeutung |
* |
Stimmt mit dem null- oder mehrmaligen Vorkommen des voranstehenden Zeichen überein.
|
+ |
Stimmt mit dem ein- oder mehrmaligen Vorkommen des voranstehenden Zeichen überein. Äquivalent zu
|
*?+? |
Passt wie
|
? |
Stimmt mit dem null- oder einmaligen Vorkommen des voranstehenden Zeichen überein.
If used immediately after any of the quantifiers Das Fragezeichen wird auch in lookahead assertions verwendet, welche unter |
x(?=y) |
Matches x only if x is followed by y. For example, /Jack(?=Sprat)/ matches 'Jack' only if it is followed by 'Sprat'. /Jack(?=Sprat|Frost)/ matches 'Jack' only if it is followed by 'Sprat' or 'Frost'. However, neither 'Sprat' nor 'Frost' is part of the match results. |
x(?!y) |
Matches
|
x|y |
Matches either
|
{n} |
Wobei
|
{n,} |
Wobei
|
{n,m} |
Wobei
|
Fußnoten
- ^Equivalent to:
[\t\n\v\f\r \u00a0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000] - ^Equivalent to:
[^\t\n\v\f\r \u00a0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000]
Eigenschaften
RegExp instances, see Properties of RegExp instances.- prototype
- Allows the addition of properties to all objects.
Methoden
RegExp instances, see Methods of RegExp instances.Das globale RegExp Objekt hat keine eigenen Methoden. Es erbt allerdings manche Mehtoden durch die Prototypenkette.
RegExp-Instanzen
Eigenschaften
See also deprecated RegExp properties.
Note that several of the RegExp properties have both long and short (Perl-like) names. Both names always refer to the same value. Perl is the programming language from which JavaScript modeled its regular expressions.
RegExp.prototype.constructor- Specifies the function that creates an object's prototype.
RegExp.prototype.flags- A string that contains the flags of the
RegExpobject. RegExp.prototype.global- Whether to test the regular expression against all possible matches in a string, or only against the first.
RegExp.prototype.ignoreCase- Whether to ignore case while attempting a match in a string.
RegExp.prototype.multiline- Whether or not to search in strings across multiple lines.
RegExp.prototype.source- The text of the pattern.
RegExp.prototype.sticky- Whether or not the search is sticky.
RegExp.prototype.unicode- Whether or not Unicode features are enabled.
Methoden
RegExp.prototype.compile()- (Re-)compiles a regular expression during execution of a script.
RegExp.prototype.exec()- Executes a search for a match in its string parameter.
RegExp.prototype.test()- Tests for a match in its string parameter.
RegExp.prototype[@@match]()- Performs match to given string and returns match result.
RegExp.prototype[@@replace]()- Replaces matches in given string with new substring.
RegExp.prototype[@@search]()- Searches the match in given string and returns the index the pattern found in the string.
RegExp.prototype[@@split]()- Splits given string into an array by separating the string into substring.
RegExp.prototype.toSource()- Returns an object literal representing the specified object; you can use this value to create a new object. Overrides the
Object.prototype.toSource()method. RegExp.prototype.toString()- Returns a string representing the specified object. Overrides the
Object.prototype.toString()method.
Beispiele
Beispiel: Anwendung regulären Ausdrucks zur Datenformatänderung
The following script uses the replace method inherited by the String instance to match a name in the format first last and output it in the format last, first. In the replacement text, the script uses $1 and $2 to indicate the results of the corresponding matching parentheses in the regular expression pattern.
var re = /(\w+)\s(\w+)/; var str = "John Smith"; var newstr = str.replace(re, "$2, $1"); print(newstr);
This displays "Smith, John".
Beispiel: Anwendung eines regulären Ausdrucks auf mehrzeilige Texte
var s = "Please yes\nmake my day!"; s.match(/yes.*day/); // Returns null s.match(/yes[^]*day/); // Returns 'yes\nmake my day'
Beispiel: Anwendung eines regulären Ausdrucks mit dem "sticky" flag
This example demonstrates how one could use the sticky flag on regular expressions to match individual lines of multiline input.
var text = "First line\nSecond line"; var regex = /(\S+) line\n?/y; var match = regex.exec(text); print(match[1]); // prints "First" print(regex.lastIndex); // prints 11 var match2 = regex.exec(text); print(match2[1]); // prints "Second" print(regex.lastIndex); // prints "22" var match3 = regex.exec(text); print(match3 === null); // prints "true"
One can test at run-time whether the sticky flag is supported, using try { … } catch { … }. For this, either an eval(…) expression or the RegExp(regex-string, flags-string) syntax must be used (since the /regex/flags notation is processed at compile-time, so throws an exception before the catch block is encountered). For example:
var supports_sticky;
try { RegExp('','y'); supports_sticky = true; }
catch(e) { supports_sticky = false; }
alert(supports_sticky); // alerts "true"
Beispiel: Regulärer Ausdruck und Unicode-Zeichen
As mentioned above, \w or \W only matches ASCII based characters; for example, 'a' to 'z', 'A' to 'Z', 0 to 9 and '_'. To match characters from other languagessuch as Cyrillic or Hebrew, use \uhhhh., where "hhhh" is the character's Unicode value in hexadecimal. This example demonstrates how one can separate out Unicode characters from a word.
var text = "Образец text на русском языке"; var regex = /[\u0400-\u04FF]+/g; var match = regex.exec(text); print(match[0]); // prints "Образец" print(regex.lastIndex); // prints "7" var match2 = regex.exec(text); print(match2[0]); // prints "на" [did not print "text"] print(regex.lastIndex); // prints "15" // and so on
Here's an external resource for getting the complete Unicode block range for different scripts: Regexp-unicode-block
Weitere nennenswerte Beispiele
Extracting subdomain name from URL
var url = "http://xxx.domain.com"; print(/[^.]+/.exec(url)[0].substr(7)); // prints "xxx"
Browserkompatibilität
| Feature | Chrome | Firefox (Gecko) | Internet Explorer | Opera | Safari (WebKit) |
|---|---|---|---|---|---|
| Basic support | ? | (Ja) | ? | ? | ? |
| Feature | Android | Firefox Mobile (Gecko) | IE Phone | Opera Mobile | Safari Mobile |
|---|---|---|---|---|---|
| Basic support | ? | (Ja) | ? | ? | ? |
Siehe auch
- Regular Expressions chapter in the JavaScript Guide