Perl - Suchen und Ersetzen

[ <= ] [ HOME ] [ INHALT ] [ INDEX ] [ => ]

Ersetzen einzelner Zeichen

Will man bestimmte Symbole durch andere ersetzen (i.a. tritt anstelle eines Zeichens genau ein anderes), so verwendet man den Operator
$string =~ tr/Suchliste/Ersetzungsliste/Optionen;
Dabei sind Such- und Ersetzungsliste jeweils Listen aus Symbolen. Beim Ersetzen wird wie folgt vorgegangen: tritt in $string das erste Zeichen der Suchliste auf, so wird dieses Zeichen entfernt und an die Stelle wird das erste Zeichen der Ersetzungsliste gesetzt. Analog wird jedes Auftreten des zweiten Zeichens der Suchliste durch das zweite Zeichen der Ersetzungliste ersetzt usw.

Beispiel:

#!/usr/local/bin/perl -w

$a = "--abcd--cde--";
print "$a\n";

$a =~ tr/abc/ABC/;
print "$a\n";

--abcd--cde--
--ABCd--Cde--

Zur Vereinfachung können mittels eines Minuszeichens "-" auch Zeichenbereiche angegeben werden (z.B. "alle Kleinbuchstaben" durch "a-z"). Die Reihenfolge der Zeichen ist dabei durch den ASCII-Code bestimmt. Will man ein Minus ersetzen, so muß es wegen dieser Sonderbedeutung an Anfang oder Ende von Such- bzw. Ersetzungliste stehen.

Tritt ein Zeichen mehrmals in der Suchliste auf, so wird es durch dasjenige Symbol der Ersetzungliste ersetzt, das als erstes als Partner auftritt. Ist die Suchliste länger als die Ersetzungsliste, so wird das letzte Zeichen der Ersetzungsliste so oft wiederholt, bis beide Listen gleich lang sind (die überzähligen Symbole der Suchliste werden also alle dem letzten Zeichen der Ersetzungsliste zugeordnet). Ist die Ersetzungsliste leer, so wird der Inhalt der Suchliste dort eingetragen (dadurch finden zwar keine ersichtlichen Ersetzungen statt, aber der Operator kann dann zum Zählen von Zeichen verwendet werden, da der Rückgabewert die Anzahl der ersetzten Zeichen ist).

#!/usr/local/bin/perl -w

$a = "--abcd--cde--";
print "$a\n\n";

($b = $a) =~ tr/a-c/A-C/;       # entspricht 'tr/abc/ABC/'
print "$b\n";
($b = $a) =~ tr/ccc/123/;       # entspricht 'tr/c/1/'
print "$b\n";
($b = $a) =~ tr/-b/+-/;
print "$b\n";
($b = $a) =~ tr/abcde/xy/;      # entspricht 'tr/abcde/xyyyy/'
print "$b\n";
$z = ($b = $a) =~ tr/-//;       # entspricht 'tr/-/-/'
print "$b ($z Minuszeichen in $a)\n";

--abcd--cde--

--ABCd--Cde--
--ab1d--1de--
++a-cd++cde++
--xyyy--yyy--
--abcd--cde-- (6 Minuszeichen in --abcd--cde--)

Anmerkung zur Zuweisung: Im obigen Beispiel wird jeweils der Variablen $b zunächst der Inhalt von $a zugewiesen, anschließend erfolgt dann die Ersetzung (nur in $b!). Die vorletzte Zeile zeigt noch, wie man den Rückgabewert der Ersetzungsoperation erhält.

Optionen:

Anstelle der Schrägstriche können im Ersetzungsoperator auch andere Zeichen gesetzt werden, wobei Klammern gesondert behandelt werden. Außerdem kann (in Anlehnung an den Ersetzungsoperator in sed) anstelle von "tr" auch "y" stehen.


[ <- ] [ HOME ] [ INHALT ] [ INDEX ] [ -> ]

Suchoperator

Eine der besonderen Stärken von Perl liegt in der Verwendung sogenannter "regulärer Ausdrücke" (regular expressions). Mit deren Hilfe lassen sich beispielsweise Zeichenketten nach bestimmten Teilstrings durchsuchen, wobei der reguläre Ausdruck wie eine Art Schablone wirkt und die Stelle gesucht wird, wo dieses Muster zum ersten Male paßt.

Der einfache Suchoperator, der reguläre Ausdrücke verwendet, sieht allgemein so aus:

$string =~ m/regexp/Optionen;
Hier wird die Zeichenkette in $string danach durchsucht, ob sich der reguläre Ausdruck "regexp" an irgendeiner Stelle darin anwenden läßt. Der Rückgabewert ist "wahr" ("true"), falls dies zutrifft, sonst "falsch" ("false"). Verwendet man anstelle von "=~" den Operator "!~", so ist der Rückgabewert genau entgegengesetzt: "true" bei erfolgloser Suche.

Statt der Schrägstriche ("/.../") können auch einige andere Zeichen benutzt werden, sofern es sich dabei nicht um alphanumerische Symbole (Buchstaben, Ziffern, Unterstrich) oder Leerzeichen (space, newline, tab,...) handelt; verwendet man Schrägstriche, kann das "m" am Anfang weggelassen werden.

Erläuterungen, was reguläre Ausdrücke sind und wie sie verwendet werden, finden sich in diesen Extra-Kapiteln:

Das Verhalten bei der Suche kann durch nachgestellte Optionen beeinflußt werden:


[ <- ] [ HOME ] [ INHALT ] [ INDEX ] [ -> ]

Spezielle Variablen

In den vorherigen Abschnitten wurden schon einige spezielle Perl-Variablen im Zusammenhang mit der Mustersuche erwähnt; hier eine Übersicht: Beispiel:

#!/usr/local/bin/perl -w

$a = "Dies ist ein Test ...";

if($a =~ /is([a-z]) (.*) Test/) {
  print $&."\n";
  print $1."\n";
  print $2."\n";
  print $+."\n";
  print $`."\n";
  print $'."\n";
}

ist ein Test
t
ein
ein
Dies 
 ...


[ <- ] [ HOME ] [ INHALT ] [ INDEX ] [ -> ]

Suchen und Ersetzen

Anstelle einer einfachen Suche kann man in Perl auch den gefundenen Ausdruck direkt durch einen neuen ersetzen. Allgemein:
$string =~ s/regexp/Ersatz/Optionen;
Dabei wird wie beim Suchoperator ("m/.../") $string nach einer zu regexp passenden Zeichenkette durchsucht. Wird ein solcher Teilstring gefunden, so wird an dessen Stelle der Text Ersatz gesetzt.

Beispiel:

#!/usr/local/bin/perl -w

$t = "Beispiel";
$t =~ s/e/-e-/;
print "$t\n";

B-e-ispiel

Im obigen Beispiel wird der String $t nach dem Buchstaben "e" abgesucht und (beim ersten Auffinden) durch die Zeichenkette "-e-" ersetzt.

Auch beim Suchen und Ersetzen können die Schrägstriche des Operators durch andere Zeichen ersetzt werden (keine alphanumerischen Symbole oder Leerzeichen).

Es können die gleichen Optionen wie beim Suchoperator verwendet werden, ihre Wirkung bezieht sich dabei auch den regulären Ausdruck. Eine zusätzliche Option ermöglicht die Auswertung des Ersatz-Teils.

Optionen:


[ <= ] [ <- ] [ HOME ] [ INHALT ] [ INDEX ] [ -> ] [ => ]

Autor: Eike Grote Letzte Änderung: 18.02.1999