准备
![Auto Field Tool Icon](../../image/uuid-b7347050-71b7-b0da-cd14-6420f0a8eca9.png)
基于列中数据将字段类型设置为尽可能小的大小。
![Create Samples Tool Icon](../../image/uuid-d9dbacd2-86eb-4467-ff7c-5735a71337d8.png)
将输入记录拆分为两个或三个随机样本。
![Data Cleansing Tool Icon](../../image/uuid-cfeca2cb-88f4-427c-c466-b795bae554ee.png)
修复常见的如 null 值和不需要字符等数据质量问题。修改大小写。
![Filter Tool Icon](../../image/uuid-69122228-92d1-770a-c737-0ffe904b58ad.png)
使用“筛选”工具根据条件选择数据。符合条件的数据行会输出至 True 锚点。
![Beaker with bubbling liquid](../../image/uuid-9dc01e86-c9f6-f365-2a11-4528d15c7499.png)
公式工具使用表达式创建和更新列。
![Box with rows, a plus sign and an arrow pointing downward.](../../image/uuid-e091bf0c-d71a-0744-36a1-225f0642e223.png)
“生成行”工具会在记录级别创建新的数据行。
![Imputation Tool Icon](../../image/uuid-19990a6e-a37c-9d9c-d815-532cb43b27fc.png)
“数值替换”工具让用户能够替换数字型数据字段中的值。
![Multi-Field Binning Tool Icon](../../image/uuid-b6d7571b-8a9a-4cd6-8033-101911252e73.png)
此工具允许用户对多个字段进行分块或装箱。
![Beaker with liquid and stir-stick.](../../image/uuid-8695ee18-29e6-83c9-a416-70fe872f4f28.png)
多字段公式工具使用一个表达式创建或更新多个字段。
![Liquid drops falling into a beaker.](../../image/uuid-2289fa1b-cf9c-8c71-ed53-b15c8c57c92e.png)
此工具使用表达式来创建和更新列,在创建公式时使用行数据。
![Oversample Field Tool Icon](../../image/uuid-3d0be916-d02e-fcb8-2695-e5d5b4cedc19.png)
此工具允许对具有较高的否定响应的数据进行标准化。
![Random % Sample Tool](../../image/uuid-b4b16910-3ed6-7de0-76d7-de55a231c245.png)
返回传入数据流的随机抽样。
![Record ID Tool Icon](../../image/uuid-915aa92e-03af-6633-3a22-cdf42b45f1a0.png)
使用记录 ID 在数据中创建一个新列,用于为数据中的每条记录分配一个按顺序递增的唯一标识符。
![Three partially full beakers](../../image/uuid-e4c37b60-0dbb-9718-a7dd-b642c9e0a5c0.png)
此工具将数据流的记录数限制为指定的数目、百分比或随机行数。
![Blue circle with four white dots at north, south east and west. Four arrows start from the middle and point to the dots.](../../image/uuid-11ca1cac-34fc-7ae1-ee72-ec8be54a4f3b.png)
此工具返回指定的记录和记录范围,
![Blue circle with a white dot, a checkmark and another dot in a line.](../../image/uuid-d779826a-75e6-81f3-2e95-4c92c87cad7b.png)
选择工具对流过工作流的数据列进行选择、排除和重新排序。
![Blue circle with three white circles inside that are in a line increasing in size from left to right.](../../image/uuid-a2f4af98-8265-6ce1-2f10-7f0a2ee4c737.png)
排序工具根据指定数据字段值的字母数字顺序,对表格中的记录进行排序。
![Blue circle with a white square in the middle that is comprised of 9 smaller squares in a 3-by-3 configuration.](../../image/uuid-ebb9b55d-8fc2-ff65-3453-d62be1bc2184.png)
此工具使用用户指定的方法根据数据中的范围分配一个值(分块)。
![Blue circle with white snowflake inside.](../../image/uuid-95081251-d8eb-14fc-ddb0-4307f66faa81.png)
此工具根据指定的字段区分一个数据记录是唯一的还是重复的。