Vorbereitung
![Auto Field Tool Icon](../../image/uuid-b7347050-71b7-b0da-cd14-6420f0a8eca9.png)
Stellen Sie den Feldtyp auf die kleinstmögliche Größe relativ zu den in der Spalte enthaltenen Daten ein.
![Create Samples Tool Icon](../../image/uuid-d9dbacd2-86eb-4467-ff7c-5735a71337d8.png)
Teilen Sie die Eingabedatensätze in zwei oder drei Zufallsstichproben auf.
![Data Cleansing Tool Icon](../../image/uuid-cfeca2cb-88f4-427c-c466-b795bae554ee.png)
Beheben Sie häufige Datenqualitätsprobleme einschließlich Nullen und unerwünschter Zeichen. Groß- und Kleinschreibung ändern
![Filter Tool Icon](../../image/uuid-69122228-92d1-770a-c737-0ffe904b58ad.png)
Verwenden Sie das Filter-Tool, um Daten über eine Bedingung auszuwählen. Datenzeilen, die die Bedingung erfüllen, werden über den True-Anker ausgegeben.
![Beaker with bubbling liquid](../../image/uuid-9dc01e86-c9f6-f365-2a11-4528d15c7499.png)
Das Formel-Tool verwendet Ausdrücke zum Erstellen und Aktualisieren von Spalten.
![Box with rows, a plus sign and an arrow pointing downward.](../../image/uuid-e091bf0c-d71a-0744-36a1-225f0642e223.png)
Mit dem Zeilen-generieren-Tool werden neue Datenzeilen auf Datensatzebene erzeugt.
![Imputation Tool Icon](../../image/uuid-19990a6e-a37c-9d9c-d815-532cb43b27fc.png)
Das Imputation-Tool ermöglicht es dem Benutzer, Werte in numerischen Datenfeldern zu ersetzen.
![Multi-Field Binning Tool Icon](../../image/uuid-b6d7571b-8a9a-4cd6-8033-101911252e73.png)
Mit diesem Tool kann ein Benutzer für mehrere Felder einen Kachel- oder Binning-Vorgang ausführen.
![Beaker with liquid and stir-stick.](../../image/uuid-8695ee18-29e6-83c9-a416-70fe872f4f28.png)
Das Berechnetes-Feld-(mehrere)-Tool erstellt oder aktualisiert mehrere Felder mit einem einzigen Ausdruck.
![Liquid drops falling into a beaker.](../../image/uuid-2289fa1b-cf9c-8c71-ed53-b15c8c57c92e.png)
Dieses Tool verwendet Ausdrücke zum Erstellen und Aktualisieren von Spalten mithilfe von Zeilendaten zum Erstellen von Formeln.
![Oversample Field Tool Icon](../../image/uuid-3d0be916-d02e-fcb8-2695-e5d5b4cedc19.png)
Dieses Tool ermöglicht es, Daten mit hohem Anteil an negativen Antworten zu normalisieren.
![Random % Sample Tool](../../image/uuid-b4b16910-3ed6-7de0-76d7-de55a231c245.png)
Gibt eine zufällige Stichprobe des eingehenden Datenstroms zurück.
![Record ID Tool Icon](../../image/uuid-915aa92e-03af-6633-3a22-cdf42b45f1a0.png)
Verwenden Sie das Datensatz-ID-Tool, um eine neue Spalte in den Daten zu erstellen und eine eindeutige ID-Nummer zuzuweisen. Diese wird in der Reihenfolge der Datensätze in den Daten erhöht.
![Three partially full beakers](../../image/uuid-e4c37b60-0dbb-9718-a7dd-b642c9e0a5c0.png)
Dieses Tool beschränkt den Datenstrom auf eine spezifische Anzahl, einen Prozentsatz oder einen zufälligen Satz von Zeilen.
![Blue circle with four white dots at north, south east and west. Four arrows start from the middle and point to the dots.](../../image/uuid-11ca1cac-34fc-7ae1-ee72-ec8be54a4f3b.png)
Dieses Tool gibt Datensätze und Datensatzbereiche zurück, die angegeben wurden,
![Blue circle with a white dot, a checkmark and another dot in a line.](../../image/uuid-d779826a-75e6-81f3-2e95-4c92c87cad7b.png)
Mit dem Datenfelder-auswählen-Tool können Sie die Datenspalten, die einen Workflow durchlaufen, auswählen, abwählen und neu anordnen.
![Blue circle with three white circles inside that are in a line increasing in size from left to right.](../../image/uuid-a2f4af98-8265-6ce1-2f10-7f0a2ee4c737.png)
Verwenden Sie das Daten-sortieren-Tool, um die Datensätze in einer Tabelle in alphanumerischer Reihenfolge auf der Basis der Werte der angegebenen Datenfelder anzuordnen.
![Blue circle with a white square in the middle that is comprised of 9 smaller squares in a 3-by-3 configuration.](../../image/uuid-ebb9b55d-8fc2-ff65-3453-d62be1bc2184.png)
Dieses Tool verwendet benutzerdefinierte Methoden, um einen Wert (Kachel) auf Basis von Bereichen in den Daten zuzuweisen.
![Blue circle with white snowflake inside.](../../image/uuid-95081251-d8eb-14fc-ddb0-4307f66faa81.png)
Dieses Tool unterscheidet, ob ein Datensatz eindeutig oder ein Duplikat basierend auf spezifizierten Feldern ist.