Pipelines

Eine der grundlegenden Funktionen in Rsh ist die Pipeline. Ein Konzept, welches seine Wurzeln tief in der Unix Philosophie hat. So wie Rsh die Arbeit mit Texten als dem Basis Datentyp in Unix erweitert, erweitert sie auch die Idee der Pipeline, um mehr als nur Text zu verarbeiten.

Grundlagen

Eine Pipeline besteht aus drei Teilen: Dem Input, dem Filter und dem Output.

> open "Cargo.toml" | inc package.version --minor | save "Cargo_new.toml"

Der erste Befehl, open "Cargo.toml", ist der Input (manchmal auch als "source" oder "producer" bezeichnet). Dieser kreiert oder ladet Daten und speist sie in die Pipeline ein. Von hier aus hat Rsh etwas zum damit arbeiten. Befehle wie ls sind ebenfalls Inputs, da sie Daten aus dem Dateisystem ziehen und in die Pipeline einspeisen.

Der zweite Befehl, inc package.version --minor, ist ein Filter. Filter verarbeiten die Daten auf eine bestimmte Weise. Vielleicht ändern sie Teile (wie der inc im Beispiel), oder sie führen eine andere Operation aus wie Loggen.

Der letzte Befehl, save "Cargo_new.toml", ist ein Output (manchmal auch "sink" genannt). Ein Output nimmt die Daten aus der Pipeline entgegen und führt eine abschliessende Operation daran aus. Im Beispiel wird der Inhalt der Pipeline als letzten Schritt in eine Datei gespeichert. Andere Arten von Output geben die Daten aus der Pipeline zum Beispiel auf der Kommandozeile aus.

Die $in Variable sammelt die Daten in der Pipeline in einen Wert, um den ganzen Strom als Parameter verwenden zu können:

> echo 1 2 3 | $in.1 * $in.2
6

Mehrzeilen Pipelines

Wenn eine Pipeline etwas lange wird für eine Zeile, kann sie mit ( und ) zu Unterausdrücken unterteilt werden:

(
    "01/22/2021" |
    parse "{month}/{day}/{year}" |
    get year
)

Siehe auch Subexpressionsopen in new window

Mit externen Befehlen arbeiten

Rsh Befehle kommunizieren miteinander über die Rsh Datentypen (see types of data), was aber ist mit Befehlen ausserhalb Rsh? Hier einige Beispiele im Umgang mit externen Befehlen:

interner_befehl| externer_befehl

Die Daten fliessen vom internen zum externen Befehl und werden dawischen zu Texten konvertiert, so dass der externe Befehl diese von stdin lesen kann.

externer_befehl | interner_befehl

Daten die von einem externen Befehl in Rsh ankommen, werden als Bytes verarbeitet, die rsh automatisch in UTF-8 konvertieren versucht. Wenn dies gelingt, wird ein Textstrom an den internen Befehl gesendet. Wenn nicht, wird ein Strom von binären Daten weitergeleitet.

Befehle wie lines helfen dabei, mit externen Daten zu arbeiten, da er diskrete Zeilen der Daten zurückgibt.

externer_befehl_1 | externer_befehl_2

Wird zwischen zwei externen Befehlen eine Pipeline aufgebaut, so verhaltet sich rsh gleich wie es z.B. Bash tun würde. Der stdout des externen_befehl_1 wiird mit dem stdin des externen_befehl_2 verbunden. Dies lässt die Daten natürlich zwischen den Befehlen fliessen.

Hinter den Kulissen

Warum gibt dann der ls Befehl eine Tabelle zurück, wenn er doch ein Input ist und kein Output? Rsh fügt diesen Output automatisch hinzu, indem sie den Befehl table verwendet. Der table Befehl wird an jede Pipeline angefügt, die keinen eigenen Output besitzen. Dies erlaubt es den Output in dieser Form zu sehen. Tatsächlich ist der Befehl:

> ls

und die Pipeline,

> ls

ein und dasselbe.

# Pipelines

# Grundlagen

# Mehrzeilen Pipelines

# Mit externen Befehlen arbeiten

# Hinter den Kulissen

Pipelines

Grundlagen

Mehrzeilen Pipelines

Mit externen Befehlen arbeiten

Hinter den Kulissen